❶ 國內做數據挖掘的有哪些公司
北京九辰科技有限公司就是做這行的。
❷ 如何系統地學習數據挖掘
首先,你要理解什麼是數據挖掘:
數據挖掘(英語:Data mining),又譯為資料探勘、數據采礦。它是資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。數據挖掘一般是指從大量的數據中通過演算法搜索隱藏於其中信息的過程。數據挖掘通常與計算機科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。
數據挖掘就業的途徑從我看來有以下幾種,(注意:本文所說的數據挖掘不包括數據倉庫或資料庫管理員的角色)。
A:做科研(在高校、科研單位以及大型企業,主要研究演算法、應用等)
B:做程序開發設計(在企業做數據挖掘及其相關程序演算法的實現等)
C:數據分析師(在存在海量數據的企事業單位做咨詢、分析等)
2.數據挖掘從業人員切入點,不同職業需要的學習課程不同:
根據上面的從業方向倒序並延伸來說說需要掌握的技能。
C,數據分析師:需要有深厚的數理統計基礎,可以不知道人工智慧和計算機編程等相關技術,但是需要熟練使用主流的數據挖掘(或統計分析)工具。從這個方面切入數據挖掘領域的話你需要學習:
《數理統計》、《概率論》、《統計學習基礎:數據挖掘、推理與預測》、《金融數據挖掘》,《業務建模與數據挖掘》、《數據挖掘實踐》、《SAS數據挖掘與分析》、《數據挖掘Clementine應用實務》、《EXCEL 2007數據挖掘完全手冊》、《中文版 數據挖掘原理》 。
B,程序設計開發:主要是實現數據挖掘現有的演算法和研發新的演算法以及根據實際需要結合核心演算法做一些程序開發實現工作。要想扮演好這個角色,你不但需要熟悉至少一門編程語言如(C,C++,Java,Delphi等)和資料庫原理和操作,對數據挖掘基礎課程有所了解,需要學習:
《數據挖掘概念與技術》(韓家煒著)、《人工智慧及其應用》、《數據挖掘:實用機器學習技術及 Java實現》。
A.做科研:這里的科研相對來說比較概括,屬於技術型的相對高級級別,也是B,C的歸宿,那麼相應的也就需要對B、C的必備基礎知識了。學習:
《數據挖掘進階》
這邊大概說一下B和C的進一步要求:
B當前主要包括如下方向:企業數據挖掘、Web數據挖掘、空間數據挖掘、多媒體數據挖掘等等;
C當前主要應用於:電信CRM、金融、咨詢業等等;
最後說一下大家有必要熟悉數據挖掘工具:Google ,或許你也可以搜索到這篇文章,當然也可以搜索到人才招聘的相關職位需求以及其他資料,一如你當初搜索到 DMResearch 一樣。
❸ 如何系統地學習數據挖掘
磨刀不誤砍柴工。在學習數據挖掘之前應該明白幾點: 數據挖掘目前在中國的尚未流行開,猶如屠龍之技。 數據初期的准備通常占整個數據挖掘項目工作量的70%左右。 數據挖掘本身融合了統計學、資料庫和機器學習等學科,並不是新的技術。 數據挖掘技術更適合業務人員學習(相比技術人員學習業務來的更高效) 數據挖掘適用於傳統的BI(報表、OLAP等)無法支持的領域。 數據挖掘項目通常需要重復一些毫無技術含量的工作。 如果你閱讀了以上內容覺得可以接受,那麼繼續往下看。 學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。技 術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合 行業之後就能夠獨當一面了,一方面有利於抓住用戶痛點和剛性需求,另一方面能夠累計行業經驗,使用互聯網思維跨界讓你更容易取得成功。不要在學習技術時想 要面面俱到,這樣會失去你的核心競爭力。 一、目前國內的數據挖掘人員工作領域大致可分為三類。 1)數據分析師:在擁有行業數據的電商、金融、電信、咨詢等行業里做業務咨詢,商務智能,出分析報告。 2)數據挖掘工程師:在多媒體、電商、搜索、社交等大數據相關行業里做機器學習演算法實現和分析。 3)科學研究方向:在高校、科研單位、企業研究院等高大上科研機構研究新演算法效率改進及未來應用。 二、說說各工作領域需要掌握的技能。 (1).數據分析師 需要有深厚的數理統計基礎,但是對程序開發能力不做要求。 需要熟練使用主流的數據挖掘(或統計分析)工具如Business Analytics and Business Intelligence Software(SAS)、SPSS、EXCEL等。 需要對與所在行業有關的一切核心數據有深入的理解,以及一定的數據敏感性培養。 經 典圖書推薦:《概率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與數據挖掘》、《數據挖掘導論》、《SAS編程與數據挖掘商業案例》、《Clementine數據挖掘方法及應用 》、《Excel 2007 VBA參考大全》、《IBM SPSS Statistics 19 Statistical Proceres Companion》等。 (2).數據挖掘工程師 需要理解主流機器學習演算法的原理和應用。 需要熟悉至少一門編程語言如(Python、C、C++、Java、Delphi等)。 需要理解資料庫原理,能夠熟練操作至少一種資料庫(Mysql、SQL、DB2、Oracle等),能夠明白MapRece的原理操作以及熟練使用Hadoop系列工具更好。 經典圖書推薦:《數據挖掘概念與技術》、《機器學習實戰》、《人工智慧及其應用》、《資料庫系統概論》、《演算法導論》、《Web數據挖掘》、《 Python標准庫》、《thinking in Java》、《Thinking in C++》、《數據結構》等。 (3).科學研究方向 需要深入學習數據挖掘的理論基礎,包括關聯規則挖掘 (Apriori和FPTree)、分類演算法(C4.5、KNN、Logistic Regression、SVM等) 、聚類演算法 (Kmeans、Spectral Clustering)。目標可以先吃透數據挖掘10大演算法各自的使用情況和優缺點。 相對SAS、SPSS來說R語言更適合科研人員The R Project for Statistical Computing,因為R軟體是完全免費的,而且開放的社區環境提供多種附加工具包支持,更適合進行統計計算分析研究。雖然目前在國內流行度不高,但是強烈推薦。 可以嘗試改進一些主流演算法使其更加快速高效,例如實現Hadoop平台下的SVM雲演算法調用平台--web 工程調用hadoop集群。 需要廣而深的閱讀世界著名會議論文跟蹤熱點技術。如KDD,ICML,IJCAI,Association for the Advancement of Artificial Intelligence,ICDM 等等;還有數據挖掘相關領域期刊:ACM Transactions on Knowledge Discovery from Data,IEEE Transactions on Knowledge and Data Engineering,Journal of Machine Learning Research Homepage,IEEE Xplore: Pattern Analysis and Machine Intelligence, IEEE Transactions on等。 可以嘗試參加數據挖掘比賽培養全方面解決實際問題的能力。如Sig KDD ,Kaggle: Go from Big Data to Big Analytics等。 可以嘗試為一些開源項目貢獻自己的代碼,比如Apache Mahout: Scalable machine learning and data mining ,myrrix等(具體可以在SourceForge或GitHub.上發現更多好玩的項目)。 經 典圖書推薦:《機器學習》 《模式分類》《統計學習理論的本質》《統計學習方法》《數據挖掘實用機器學習技術》《R語言實踐》,英文素質是科研人才必備的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等。 三、以下是通信行業數據挖掘工程師的工作感受。 真 正從數據挖掘項目實踐的角度講,溝通能力對挖掘的興趣愛好是最重要的,有了愛好才可以願意鑽研,有了不錯的溝通能力,才可以正確理解業務問題,才能正確把 業務問題轉化成挖掘問題,才可以在相關不同專業人才之間清楚表達你的意圖和想法,取得他們的理解和支持。所以我認為溝通能力和興趣愛好是個人的數據挖掘的 核心競爭力,是很難學到的;而其他的相關專業知識誰都可以學,算不上個人發展的核心競爭力。 說到這里可能很多數據倉庫專家、程序員、統計 師等等都要扔磚頭了,對不起,我沒有別的意思,你們的專業對於數據挖掘都很重要,大家本來就是一個整體的,但是作為單獨一個個體的人來說,精力有限,時間 有限,不可能這些領域都能掌握,在這種情況下,選擇最重要的核心,我想應該是數據挖掘技能和相關業務能力吧(從另外的一個極端的例子,我們可以看, 比如一個迷你型的挖掘項目,一個懂得市場營銷和數據挖掘技能的人應該可以勝任。這其中他雖然不懂數據倉庫,但是簡單的Excel就足以勝任高打6萬個樣本 的數據處理;他雖然不懂專業的展示展現技能,但是只要他自己看的懂就行了,這就無需什麼展示展現;前面說過,統計技能是應該掌握的,這對一個人的迷你項目 很重要;他雖然不懂編程,但是專業挖掘工具和挖掘技能足夠讓他操練的;這樣在迷你項目中,一個懂得挖掘技能和市場營銷業務能力的人就可以圓滿完成了,甚至 在一個數據源中根據業務需求可以無窮無盡的挖掘不同的項目思路,試問就是這個迷你項目,單純的一個數據倉庫專家、單純的一個程序員、單純的一個展示展現技 師、甚至單純的一個挖掘技術專家,都是無法勝任的)。這從另一個方面也說明了為什麼溝通能力的重要,這些個完全不同的專業領域,想要有效有機地整合在一起 進行數據挖掘項目實踐,你說沒有好的溝通能力行嗎? 數據挖掘能力只能在項目實踐的熔爐中提升、升華,所以跟著項目學挖掘是最有效的捷徑。 國外學習挖掘的人都是一開始跟著老闆做項目,剛開始不懂不要緊,越不懂越知道應該學什麼,才能學得越快越有效果。我不知道國內的數據挖掘學生是怎樣學的, 但是從網上的一些論壇看,很多都是紙上談兵,這樣很浪費時間,很沒有效率。 另外現在國內關於數據挖掘的概念都很混亂,很多BI只是局限在 報表的展示和簡單的統計分析,卻也號稱是數據挖掘;另一方面,國內真正規模化實施數據挖掘的行業是屈指可數(銀行、保險公司、移動通訊),其他行業的應用 就只能算是小規模的,比如很多大學都有些相關的挖掘課題、挖掘項目,但都比較分散,而且都是處於摸索階段,但是我相信數據挖掘在中國一定是好的前景,因為 這是歷史發展的必然。 講到移動方面的實踐案例,如果你是來自移動的話,你一定知道國內有家叫華院分析的公司(申明,我跟這家公司沒有任何 關系,我只是站在數據挖掘者的角度分析過中國大多數的號稱數據挖掘服務公司,覺得華院還不錯,比很多徒有虛名的大公司來得更實際),他們的業務現在已經覆 蓋了絕大多數中國省級移動公司的分析挖掘項目,你上網搜索一下應該可以找到一些詳細的資料吧。我對華院分析印象最深的一點就是2002年這個公司白手起 家,自己不懂不要緊,一邊自學一邊開始拓展客戶,到現在在中國的移動通訊市場全面開花,的確佩服佩服呀。他們最開始都是用EXCEL處理數據,用肉眼比較 選擇比較不同的模型,你可以想像這其中的艱難吧。 至於移動通訊的具體的數據挖掘的應用,那太多了,比如不同話費套餐的制訂、客戶流失模 型、不同服務交叉銷售模型、不同客戶對優惠的彈性分析、客戶群體細分模型、不同客戶生命周期模型、渠道選擇模型、惡意欺詐預警模型,太多了,記住,從客戶 的需求出發,從實踐中的問題出發,移動中可以發現太多的挖掘項目。最後告訴你一個秘密,當你數據挖掘能力提升到一定程度時,你會發現無論什麼行業,其實數 據挖掘的應用有大部分是重合的相似的,這樣你會覺得更輕松。 四、成為一名數據科學家需要掌握的技能圖。(原文:Data Science: How do I become a data scientist?)
❹ 如何系統地學習數據挖掘
磨刀不誤砍柴工。在學習數據挖掘之前應該明白幾點:
數據挖掘目前在中國的尚未流行開,猶如屠龍之技。
數據初期的准備通常占整個數據挖掘項目工作量的70%左右。
數據挖掘本身融合了統計學、資料庫和機器學習等學科,並不是新的技術。
數據挖掘技術更適合業務人員學習(相比技術人員學習業務來的更高效)
數據挖掘適用於傳統的BI(報表、OLAP等)無法支持的領域。
數據挖掘項目通常需要重復一些毫無技術含量的工作。
如果你閱讀了以上內容覺得可以接受,那麼繼續往下看。
學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。技術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合行業之後就能夠獨當一面了,一方面有利於抓住用戶痛點和剛性需求,另一方面能夠累計行業經驗,使用互聯網思維跨界讓你更容易取得成功。不要在學習技術時想要面面俱到,這樣會失去你的核心競爭力。
一、目前國內的數據挖掘人員工作領域大致可分為三類。
1)數據分析師:在擁有行業數據的電商、金融、電信、咨詢等行業里做業務咨詢,商務智能,出分析報告。
2)數據挖掘工程師:在多媒體、電商、搜索、社交等大數據相關行業里做機器學習演算法實現和分析。
3)科學研究方向:在高校、科研單位、企業研究院等高大上科研機構研究新演算法效率改進及未來應用。
二、說說各工作領域需要掌握的技能。
(1).數據分析師
需要有深厚的數理統計基礎,但是對程序開發能力不做要求。
需要熟練使用主流的數據挖掘(或統計分析)工具如Business Analytics and Business Intelligence Software(SAS)、SPSS、EXCEL等。
需要對與所在行業有關的一切核心數據有深入的理解,以及一定的數據敏感性培養。
經典圖書推薦:《概率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與數據挖掘》、《數據挖掘導論》、《SAS編程與數據挖掘商業案例》、《Clementine數據挖掘方法及應用 》、《Excel 2007 VBA參考大全》、《IBM SPSS Statistics 19 Statistical Proceres Companion》等。
(2).數據挖掘工程師
需要理解主流機器學習演算法的原理和應用。
需要熟悉至少一門編程語言如(Python、C、C++、Java、Delphi等)。
需要理解資料庫原理,能夠熟練操作至少一種資料庫(Mysql、SQL、DB2、Oracle等),能夠明白MapRece的原理操作以及熟練使用Hadoop系列工具更好。
經典圖書推薦:《數據挖掘概念與技術》、《機器學習實戰》、《人工智慧及其應用》、《資料庫系統概論》、《演算法導論》、《Web數據挖掘》、《 Python標准庫》、《thinking in Java》、《Thinking in C++》、《數據結構》等。
(3).科學研究方向
需要深入學習數據挖掘的理論基礎,包括關聯規則挖掘 (Apriori和FPTree)、分類演算法(C4.5、KNN、Logistic Regression、SVM等) 、聚類演算法 (Kmeans、Spectral Clustering)。目標可以先吃透數據挖掘10大演算法各自的使用情況和優缺點。
相對SAS、SPSS來說R語言更適合科研人員The R Project for Statistical Computing,因為R軟體是完全免費的,而且開放的社區環境提供多種附加工具包支持,更適合進行統計計算分析研究。雖然目前在國內流行度不高,但是強烈推薦。
可以嘗試改進一些主流演算法使其更加快速高效,例如實現Hadoop平台下的SVM雲演算法調用平台--web 工程調用hadoop集群。
需要廣而深的閱讀世界著名會議論文跟蹤熱點技術。如KDD,ICML,IJCAI,Association for the Advancement of Artificial Intelligence,ICDM 等等;還有數據挖掘相關領域期刊:ACM Transactions on Knowledge Discovery from Data,IEEE Transactions on Knowledge and Data Engineering,Journal of Machine Learning Research Homepage,IEEE Xplore: Pattern Analysis and Machine Intelligence, IEEE Transactions on等。
可以嘗試參加數據挖掘比賽培養全方面解決實際問題的能力。如Sig KDD ,Kaggle: Go from Big Data to Big Analytics等。
可以嘗試為一些開源項目貢獻自己的代碼,比如Apache Mahout: Scalable machine learning and data mining ,myrrix等(具體可以在SourceForge或GitHub.上發現更多好玩的項目)。
經典圖書推薦:《機器學習》 《模式分類》《統計學習理論的本質》《統計學習方法》《數據挖掘實用機器學習技術》《R語言實踐》,英文素質是科研人才必備的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等。
三、以下是通信行業數據挖掘工程師的工作感受。
真正從數據挖掘項目實踐的角度講,溝通能力對挖掘的興趣愛好是最重要的,有了愛好才可以願意鑽研,有了不錯的溝通能力,才可以正確理解業務問題,才能正確把業務問題轉化成挖掘問題,才可以在相關不同專業人才之間清楚表達你的意圖和想法,取得他們的理解和支持。所以我認為溝通能力和興趣愛好是個人的數據挖掘的核心競爭力,是很難學到的;而其他的相關專業知識誰都可以學,算不上個人發展的核心競爭力。
說到這里可能很多數據倉庫專家、程序員、統計師等等都要扔磚頭了,對不起,我沒有別的意思,你們的專業對於數據挖掘都很重要,大家本來就是一個整體的,但是作為單獨一個個體的人來說,精力有限,時間有限,不可能這些領域都能掌握,在這種情況下,選擇最重要的核心,我想應該是數據挖掘技能和相關業務能力吧(從另外的一個極端的例子,我們可以看, 比如一個迷你型的挖掘項目,一個懂得市場營銷和數據挖掘技能的人應該可以勝任。這其中他雖然不懂數據倉庫,但是簡單的Excel就足以勝任高打6萬個樣本的數據處理;他雖然不懂專業的展示展現技能,但是只要他自己看的懂就行了,這就無需什麼展示展現;前面說過,統計技能是應該掌握的,這對一個人的迷你項目很重要;他雖然不懂編程,但是專業挖掘工具和挖掘技能足夠讓他操練的;這樣在迷你項目中,一個懂得挖掘技能和市場營銷業務能力的人就可以圓滿完成了,甚至在一個數據源中根據業務需求可以無窮無盡的挖掘不同的項目思路,試問就是這個迷你項目,單純的一個數據倉庫專家、單純的一個程序員、單純的一個展示展現技師、甚至單純的一個挖掘技術專家,都是無法勝任的)。這從另一個方面也說明了為什麼溝通能力的重要,這些個完全不同的專業領域,想要有效有機地整合在一起進行數據挖掘項目實踐,你說沒有好的溝通能力行嗎?
數據挖掘能力只能在項目實踐的熔爐中提升、升華,所以跟著項目學挖掘是最有效的捷徑。國外學習挖掘的人都是一開始跟著老闆做項目,剛開始不懂不要緊,越不懂越知道應該學什麼,才能學得越快越有效果。我不知道國內的數據挖掘學生是怎樣學的,但是從網上的一些論壇看,很多都是紙上談兵,這樣很浪費時間,很沒有效率。
另外現在國內關於數據挖掘的概念都很混亂,很多BI只是局限在報表的展示和簡單的統計分析,卻也號稱是數據挖掘;另一方面,國內真正規模化實施數據挖掘的行業是屈指可數(銀行、保險公司、移動通訊),其他行業的應用就只能算是小規模的,比如很多大學都有些相關的挖掘課題、挖掘項目,但都比較分散,而且都是處於摸索階段,但是我相信數據挖掘在中國一定是好的前景,因為這是歷史發展的必然。
講到移動方面的實踐案例,如果你是來自移動的話,你一定知道國內有家叫華院分析的公司(申明,我跟這家公司沒有任何關系,我只是站在數據挖掘者的角度分析過中國大多數的號稱數據挖掘服務公司,覺得華院還不錯,比很多徒有虛名的大公司來得更實際),他們的業務現在已經覆蓋了絕大多數中國省級移動公司的分析挖掘項目,你上網搜索一下應該可以找到一些詳細的資料吧。我對華院分析印象最深的一點就是2002年這個公司白手起家,自己不懂不要緊,一邊自學一邊開始拓展客戶,到現在在中國的移動通訊市場全面開花,的確佩服佩服呀。他們最開始都是用EXCEL處理數據,用肉眼比較選擇比較不同的模型,你可以想像這其中的艱難吧。
至於移動通訊的具體的數據挖掘的應用,那太多了,比如不同話費套餐的制訂、客戶流失模型、不同服務交叉銷售模型、不同客戶對優惠的彈性分析、客戶群體細分模型、不同客戶生命周期模型、渠道選擇模型、惡意欺詐預警模型,太多了,記住,從客戶的需求出發,從實踐中的問題出發,移動中可以發現太多的挖掘項目。最後告訴你一個秘密,當你數據挖掘能力提升到一定程度時,你會發現無論什麼行業,其實數據挖掘的應用有大部分是重合的相似的,這樣你會覺得更輕松。
❺ 聚商圈邀請一號店副總裁張高峰老師講解傳統企業如何互聯網轉型,課程主要講了什麼呢
互聯網改變了人們的生活習慣,對很多傳統行業形成明顯沖擊,企業家們都迫切地想知道,在新的經濟形勢下自己的企業到底該如何擁抱互聯網,是互聯網+應該還是+互聯網?
9月3日—4日,聚商圈《互聯網思維與傳統企業轉型》總裁班在北京隆重開幕,大咖級導師張高峰親臨授課指導,來自全國各地各行各業的百餘名企業家相聚在此,共享互聯網思維與企業轉型盛宴。由於主題內容與時代的契合度極高,很多人都是早早的來到現場報道,全場座無虛席。
張高峰,聚商圈轉型升級創業導師,現任1號店副總裁,曾在華院分析任研究總監,大數據技術與應用領域的資深專家,曾四年多領導阿里巴巴B2B的BI工作。
在互聯網快速顛覆傳統行業的年代裡,絕大多數企業都深感升級、創新和轉型的壓力,他(她)們其實非常明白趨勢----他們已經不想聽理論,而是要實戰、接地氣、可驗證的落地工具。張高峰老師說,互聯網的到來其實並不可怕,因為商業的本質沒有改變。經商的本質從來都是利他的。自利則生,利他則久。對他人有價值,然後自己順便賺點錢;如果做生意剛開始就是准備自己掙錢,那麼生意做不大。
張高峰老師說:想做互聯網企業,想要做互聯網+、或者是+互聯網,你都必須要了解互聯網企業是怎麼做的,要了解互聯網的歷史,互聯網的發展,你才能看的出互聯網的本質。互聯網的存在就是加深人與人之間的連接,只有把這個弄清楚了,才知道我們傳統企業應該如何更好的擁抱互聯網。「平等、開放、共享、聯接」這就是互聯網精神!
從人工智慧之父圖靈到喬布斯、比爾蓋茨,從互聯網1.0講到互聯網2.0,從谷歌、雅虎到1號店、雕爺牛腩,通過一個個鮮活的案例和故事將這些深奧、晦澀的術語講得通俗易懂。隨後,張高峰老師又用互聯網企業韓都衣舍和傳統企業成功轉型互聯網化的海爾集團為大家做深入的剖析,每個案例都做了全方位解讀,切膚之痛,刀刀見血。在場所有人都聽得得痛快淋漓,積極的做著筆記,跟著老師在互聯網的發展史中,來回穿越著。
互聯網的本質到底是什麼?
什麼是互聯網+?什麼是+互聯網?
傳統企業擁抱互聯網有哪幾種模式?
未來,互聯網將會被物聯網所替代?
所有的在轉型過程中遇到的問題、難題都在課堂上找到了科學的答案。張高峰老師說,互聯網的本質就是連接。所有傳統企業擁抱互聯網在PC時代不等於建網站,在移動互聯網時代不等於開發APP,轉型要理解連接的精髓。如果你的網站沒有被連入別人的網站當中,那麼網站就是死網站,如果APP不能連接到用戶的手機當中,那麼這個APP也是一個沒有活力的APP,因為它不符合互聯網生物進化的過程。
張高峰老師說,現在互聯網已經從PC端進入了移動端,目前有9成的人已經進入了移動互聯網的時代,移動互聯網就是要有更多的鏈接,每天每人平均花在手機上的時間將近3小時,我們睜開眼的第一時間是找手機,睡覺前的時間是關手機。現在數據正在以光的速度,打破時間、空間的阻隔在移動端進行傳播。移動互聯網可以連接一切!傳統企業如何轉型,互聯網思維我們需要去感受,去學習。
在場企業家紛紛表示,關於互聯網轉型,之前是一個非常模糊的概念,從來沒有接受過如此高專業度的學習,但今天從互聯網發展史上去了解互聯網,對互聯網本身有了一個前所未有的全新認識,在今後的轉型道路上也會有更加清晰的指導意義。在場企業家聽完課都醍醐灌頂、如沐春風。正如九月的北京,晴空萬里,澄澈如洗。
現如今,很多企業雖然已經把轉型升級上升到戰略層面,但是對於互聯網的本質、互聯網思維如何讓轉型落地等問題依舊處於摸著石頭過河的階段,兩天一夜的課程勢必對今後的轉型之路起到清晰、明確的指導意義。
❻ 華院分析怎麼樣
你參考下 .
華院分析技術(上海)有限公司
項目經理/數據分析師 | 8001-10000元/月 本科3年工作經驗
專業服務(咨詢/財會/法律等) | 民營 | 100-499人
❼ 支付寶為啥轉款華院分析技術
支付寶與這個軟體公司進行了技術合作,一定是購買了技術服務,才會有資金流動。
❽ 如何系統地學習數據挖掘
磨刀不誤砍柴工。在學習數據挖掘之前應該明白幾點:
數據挖掘目前在中國的尚未流行開,猶如屠龍之技。
數據初期的准備通常占整個數據挖掘項目工作量的70%左右。
數據挖掘本身融合了統計學、資料庫和機器學習等學科,並不是新的技術。
數據挖掘技術更適合業務人員學習(相比技術人員學習業務來的更高效)
數據挖掘適用於傳統的BI(報表、OLAP等)無法支持的領域。
數據挖掘項目通常需要重復一些毫無技術含量的工作。
如果你閱讀了以上內容覺得可以接受,那麼繼續往下看。
學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。技
術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合
行業之後就能夠獨當一面了,一方面有利於抓住用戶痛點和剛性需求,另一方面能夠累計行業經驗,使用互聯網思維跨界讓你更容易取得成功。不要在學習技術時想
要面面俱到,這樣會失去你的核心競爭力。
一、目前國內的數據挖掘人員工作領域大致可分為三類。
1)數據分析師:在擁有行業數據的電商、金融、電信、咨詢等行業里做業務咨詢,商務智能,出分析報告。
2)數據挖掘工程師:在多媒體、電商、搜索、社交等大數據相關行業里做機器學習演算法實現和分析。
3)科學研究方向:在高校、科研單位、企業研究院等高大上科研機構研究新演算法效率改進及未來應用。
二、說說各工作領域需要掌握的技能。
(1).數據分析師
需要有深厚的數理統計基礎,但是對程序開發能力不做要求。
需要熟練使用主流的數據挖掘(或統計分析)工具如Business Analytics and Business Intelligence Software(SAS)、SPSS、EXCEL等。
需要對與所在行業有關的一切核心數據有深入的理解,以及一定的數據敏感性培養。
經
典圖書推薦:《概率論與數理統計》、《統計學》推薦David
Freedman版、《業務建模與數據挖掘》、《數據挖掘導論》、《SAS編程與數據挖掘商業案例》、《Clementine數據挖掘方法及應用
》、《Excel 2007 VBA參考大全》、《IBM SPSS Statistics 19 Statistical Proceres
Companion》等。
(2).數據挖掘工程師
需要理解主流機器學習演算法的原理和應用。
需要熟悉至少一門編程語言如(Python、C、C++、Java、Delphi等)。
需要理解資料庫原理,能夠熟練操作至少一種資料庫(Mysql、SQL、DB2、Oracle等),能夠明白MapRece的原理操作以及熟練使用Hadoop系列工具更好。
經典圖書推薦:《數據挖掘概念與技術》、《機器學習實戰》、《人工智慧及其應用》、《資料庫系統概論》、《演算法導論》、《Web數據挖掘》、《 Python標准庫》、《thinking in Java》、《Thinking in C++》、《數據結構》等。
(3).科學研究方向
需要深入學習數據挖掘的理論基礎,包括關聯規則挖掘 (Apriori和FPTree)、分類演算法(C4.5、KNN、Logistic Regression、SVM等) 、聚類演算法 (Kmeans、Spectral Clustering)。目標可以先吃透數據挖掘10大演算法各自的使用情況和優缺點。
相對SAS、SPSS來說R語言更適合科研人員The R Project for Statistical Computing,因為R軟體是完全免費的,而且開放的社區環境提供多種附加工具包支持,更適合進行統計計算分析研究。雖然目前在國內流行度不高,但是強烈推薦。
可以嘗試改進一些主流演算法使其更加快速高效,例如實現Hadoop平台下的SVM雲演算法調用平台--web 工程調用hadoop集群。
需要廣而深的閱讀世界著名會議論文跟蹤熱點技術。如KDD,ICML,IJCAI,Association for the Advancement of Artificial Intelligence,ICDM 等等;還有數據挖掘相關領域期刊:ACM Transactions on Knowledge Discovery from Data,IEEE Transactions on Knowledge and Data Engineering,Journal of Machine Learning Research Homepage,IEEE Xplore: Pattern Analysis and Machine Intelligence, IEEE Transactions on等。
可以嘗試參加數據挖掘比賽培養全方面解決實際問題的能力。如Sig KDD ,Kaggle: Go from Big Data to Big Analytics等。
可以嘗試為一些開源項目貢獻自己的代碼,比如Apache Mahout: Scalable machine learning and data mining ,myrrix等(具體可以在SourceForge或GitHub.上發現更多好玩的項目)。
經
典圖書推薦:《機器學習》
《模式分類》《統計學習理論的本質》《統計學習方法》《數據挖掘實用機器學習技術》《R語言實踐》,英文素質是科研人才必備的《Machine
Learning: A Probabilistic Perspective》《Scaling up Machine Learning :
Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise
Miner : A Case Study Approach》《Python for Data Analysis》等。
三、以下是通信行業數據挖掘工程師的工作感受。
真
正從數據挖掘項目實踐的角度講,溝通能力對挖掘的興趣愛好是最重要的,有了愛好才可以願意鑽研,有了不錯的溝通能力,才可以正確理解業務問題,才能正確把
業務問題轉化成挖掘問題,才可以在相關不同專業人才之間清楚表達你的意圖和想法,取得他們的理解和支持。所以我認為溝通能力和興趣愛好是個人的數據挖掘的
核心競爭力,是很難學到的;而其他的相關專業知識誰都可以學,算不上個人發展的核心競爭力。
說到這里可能很多數據倉庫專家、程序員、統計
師等等都要扔磚頭了,對不起,我沒有別的意思,你們的專業對於數據挖掘都很重要,大家本來就是一個整體的,但是作為單獨一個個體的人來說,精力有限,時間
有限,不可能這些領域都能掌握,在這種情況下,選擇最重要的核心,我想應該是數據挖掘技能和相關業務能力吧(從另外的一個極端的例子,我們可以看,
比如一個迷你型的挖掘項目,一個懂得市場營銷和數據挖掘技能的人應該可以勝任。這其中他雖然不懂數據倉庫,但是簡單的Excel就足以勝任高打6萬個樣本
的數據處理;他雖然不懂專業的展示展現技能,但是只要他自己看的懂就行了,這就無需什麼展示展現;前面說過,統計技能是應該掌握的,這對一個人的迷你項目
很重要;他雖然不懂編程,但是專業挖掘工具和挖掘技能足夠讓他操練的;這樣在迷你項目中,一個懂得挖掘技能和市場營銷業務能力的人就可以圓滿完成了,甚至
在一個數據源中根據業務需求可以無窮無盡的挖掘不同的項目思路,試問就是這個迷你項目,單純的一個數據倉庫專家、單純的一個程序員、單純的一個展示展現技
師、甚至單純的一個挖掘技術專家,都是無法勝任的)。這從另一個方面也說明了為什麼溝通能力的重要,這些個完全不同的專業領域,想要有效有機地整合在一起
進行數據挖掘項目實踐,你說沒有好的溝通能力行嗎?
數據挖掘能力只能在項目實踐的熔爐中提升、升華,所以跟著項目學挖掘是最有效的捷徑。
國外學習挖掘的人都是一開始跟著老闆做項目,剛開始不懂不要緊,越不懂越知道應該學什麼,才能學得越快越有效果。我不知道國內的數據挖掘學生是怎樣學的,
但是從網上的一些論壇看,很多都是紙上談兵,這樣很浪費時間,很沒有效率。
另外現在國內關於數據挖掘的概念都很混亂,很多BI只是局限在
報表的展示和簡單的統計分析,卻也號稱是數據挖掘;另一方面,國內真正規模化實施數據挖掘的行業是屈指可數(銀行、保險公司、移動通訊),其他行業的應用
就只能算是小規模的,比如很多大學都有些相關的挖掘課題、挖掘項目,但都比較分散,而且都是處於摸索階段,但是我相信數據挖掘在中國一定是好的前景,因為
這是歷史發展的必然。
講到移動方面的實踐案例,如果你是來自移動的話,你一定知道國內有家叫華院分析的公司(申明,我跟這家公司沒有任何
關系,我只是站在數據挖掘者的角度分析過中國大多數的號稱數據挖掘服務公司,覺得華院還不錯,比很多徒有虛名的大公司來得更實際),他們的業務現在已經覆
蓋了絕大多數中國省級移動公司的分析挖掘項目,你上網搜索一下應該可以找到一些詳細的資料吧。我對華院分析印象最深的一點就是2002年這個公司白手起
家,自己不懂不要緊,一邊自學一邊開始拓展客戶,到現在在中國的移動通訊市場全面開花,的確佩服佩服呀。他們最開始都是用EXCEL處理數據,用肉眼比較
選擇比較不同的模型,你可以想像這其中的艱難吧。
至於移動通訊的具體的數據挖掘的應用,那太多了,比如不同話費套餐的制訂、客戶流失模
型、不同服務交叉銷售模型、不同客戶對優惠的彈性分析、客戶群體細分模型、不同客戶生命周期模型、渠道選擇模型、惡意欺詐預警模型,太多了,記住,從客戶
的需求出發,從實踐中的問題出發,移動中可以發現太多的挖掘項目。最後告訴你一個秘密,當你數據挖掘能力提升到一定程度時,你會發現無論什麼行業,其實數
據挖掘的應用有大部分是重合的相似的,這樣你會覺得更輕松。
四、成為一名數據科學家需要掌握的技能圖。(原文:Data Science: How do I become a data scientist?)
❾ 求數據分析、數據挖掘公司推薦,類似華院分析等
瑞尼爾,埃森哲,尼爾森,做數據分析都挺猛的~~
有好多咨詢公司都會招一些數據分析的,你上網仔細看吧