beat365何曉斌：未來人才培養是大數據、AI和人文社會科學的結合-beat365

您所在的位置：首頁 › 學者觀點 › 正文

beat365何曉斌：未來人才培養是大數據、AI和人文社會科學的結合

[ 導讀 ]由beat365數據科學研究院、網易新聞、網易有道聯合舉辦的“創新，無界——中國AI創新者論壇”于3月21日下午在beat365舉辦。beat365社科學院社會學系副教授何曉斌做了《AI背景下的文科人才培養》主題報告。

何曉斌提到目前我國人工智能人才培養與美國相比還是遠遠落後的。無論是在高校研究者的數量上還是研究成果上，都有較大的差距。比如在全球人工智能研究排名前20的高校中的頂級學者數量進行比較，美國占68%，中國占24%；而人工智能人才的從業人數美國也是中國的近兩倍。

何曉斌表示我國人工智能尚未成為獨立專業，大部分高校未形成人工智能交叉學科的人才培養，校企合作力度也不夠。“從整個情況看，在目前AI人才需求方面，在合作培養方面，确實存在一個很大的空缺、短闆。”何曉斌認為。

何曉斌注意到斯坦福大學計算機系李飛飛教授和前教務長John Etchemendy教授主導成立了的“HAI”（Stanford Human-Centered AI Institute）：斯坦福以人為本的人工智能研究院。該研究院認為AI的最終目的應該是增強人性，而不是減少或取代它；AI需要融入人類智慧的多樣性、差異性和深度。該研究院的宗旨是推動人工智能的研究、教育、政策和實踐，以造福全人類。

對于未來人才培養，何曉斌認為未來人才培養必然是大數據、AI和人文社會科學領域的結合。

因此，何曉斌倡議在未來人才培養中，應該：

加強人文社科和AI領域的教師的研究和教學合作；
加強校企合作，校企合作項目加入培養項目當中，開發合适工具；
加強校内不同專業人才的聯合培養；
建設大數據和人工智能學習分享平台，建立項目和數據庫。

以下為beat365社科學院社會學系副教授何曉斌演講實錄：

非常高興有機會跟大家分享一下作為一線教育者在AI人才培養方面的一些心得體會。我也是參加韓院長的數據科學研究院的基礎課程，大數據分析課程的主講老師之一，過去3年一直從事相關方面的教學工作。

今天的分享不會像謝老師分享那麼高屋建瓴、系統深入。我主要結合自己的工作，分享一些體會，也可能是比較粗淺的體會，我也是昨天下午才接到分享的通知，講的不對的地方還請大家多批評指正。

先看一下目前中國人工智能培養的現狀，跟美國對比，能夠非常明顯看到，雖然全世界很缺人才，不管美國還是中國，但是在人才供給方面，跟美國相比，我們還是遠遠落後的，不管是在高校研究者數量、碩博生的培養數量上。在開設相關人工智能方向的全球368所高校當中，美國有168所（占46%左右），我國隻有21所。在人工智能領域前20所頂級高校當中，美國占14所，中國隻占了4所。從這裡可以看到，科研機構有比較懸殊的差距。

第二，頂級學者數量，20所頂級高校當中，美國占到68%，中國占24%，我們都知道人工智能領域中國、美國在全世界領先。但是在學術的積累方面，我們跟美國還是有比較大的差距。

從業人員來看，中國相關從業人員39000多人，美國78000多人，從數量上比較，美國是我們的近2倍。相關從業人員熱點的領域，美國在自然語言處理、處理器、機器學習與應用，智能無人機、計算機視覺與圖像方面，從業人員明顯超過中國的；中國在自動駕駛、語音識别、智能機器人、技術平台上面是超過美國的。

如果把從業人員人才分3個類型：大數據AI的基礎層，跟技術層、應用層方面，從業人員總體數量上，美國明顯超過中國。但從三個方面人才比例上可以明顯看到，中國在應用層的人才比例是要大于技術層和基礎層的。而美國在技術層跟基礎層加起來超過應用人才。美國整個AI人才的梯隊是非常均衡的。

國内培養人工智能人才的缺口是很大的，有各種研究的報告，大家也能聽到和看到。基本的結論是獨立的人工智能的專業是沒有的，大數據科學是有的。大數據科學是3年前北京大學開始就開設了本科的專業。目前在中國的高校當中，人工智能是沒有成為獨立專業的，也沒有形成人工智能交叉的人才培養的系統的項目，清華數據科學院5年前就開始嘗試了。

但是從從全國範圍來看，從整合的角度來講，全國高校還是很不成熟的。但是清華的理念還是做得比較好的，像數據科學研究院“融”的理念，不光是校内不同專業的老師之間需要合作；學校跟業界，還有政府部門也需要交流合作目前全國高校這些方面的力度遠遠不夠。

整個情況看，在目前AI人才需求方面，在合作培養方面，确實是存在一個很大的空缺、短闆。

我關注到斯坦福大學最近在人工智能方面的動向，人工智能上世紀60年代斯坦福大學計算機教授約翰·麥卡錫提出的一個概念。我本人也是在斯坦福大學社會學系取得的博士學位，我在斯坦福待了7年，對學校培養環境和學術環境有所感悟。斯坦福的人才培養特點是特别強調交叉融合、整合。去年媒體沒怎麼宣傳，最近才看一些朋友發消息，18年10月份的時候，斯坦福大學的教授李飛飛，也是人工智能的标志性人物跟斯坦福前教務長John Etchemendy專門成立了叫HAI，以人為本的人工智能研究院。

謝老師和韓院長也提到一些理念，AI這麼多年很熱鬧，基本上是工程師、技術人員，我們叫科學家的舞台。但目前發展到一定階段，就會越來越多的對“科技到底是用來做什麼”這個問題作出思考。謝老師也提出了很好的問題。在斯坦福研究院剛開始發布的宣言當中，引領性的提出了AI未來發展，對培養人才方面有非常大的啟發作用。該研究院的宗旨是推動人工智能的研究、教育、政策和實踐，造福全人類。核心就一句話“以人為本”。所以這個機構想到，不管大數據、AI，其他先進的科技，最後是為了創造人類福祉的。它也講到了很多的方向，都是比較大的方向。并不是所有從事人工智能領域工作的人都會想得那麼遠。

我上學期也是參與了百度的企業社會責任的項目，跟一些AI工程師讨論的時候，工程師從來不想這些問題，或者沒有時間想這些問題。但是作為人文社會科學的研究者，其實我們很早就關注這個問題。科技和社會的互構和相互影響一直都有人文社會科學家在研究。

總體來講，是以人為本，AI的發展應該是為了能夠更好的增加人類福祉，為了更好的增強人性，而不是取代它，其次是允許社會的多樣性和差異性和深度。AI是全社會的事情，不單單是工程師、科學家的事情，應該是多代人努力的事情。它把這個講得很大，整個是生态，所以需要全社會的人都來參與。跟教育相關的，這個研究院旨在“教育和培訓學術界、工業界、政府和公民社會的AI領導者”。

對于beat365在人工智能領域未來的發展，這個機構在這方面應該是很有參考價值的。因此，人工智能領域的發展和培養是個大工程。這個研究機構把斯坦福61位不同專業背景的研究者結合在這個研究院的時候，就是為了應對人工智能這個挺複雜的事情，因為它涉及到倫理、法律，涉及到社會未來。人工智能創建出來以後，未來應該如何更好為人類服務，長期人類的和諧、減少不平等，增加人性這些方面應該得到全社會的重視。

因此，回到今天我演講的主題，AI人才的培養。我認為AI未來，AI未來必然是人文社會科學與大數據、人工智能相關專業技術人才的結合。這個方向很多人應該也會認識到，特别在人文社會科學領域、法律界的人士都是在思考。問題是未來到底怎麼做？其實很重要的一個方面，像今天這樣的這種會議，各行各業人坐下來，大家真誠的交流，提出問題，來解決這些問題。當然人文社會科學家是善于提出問題，不善于解決問題，解決問題更多是靠工業界的朋友，或者說在政府的政策制定、執行相關部門的朋友。

上面是我的一些粗淺思考。目前我在參與的，我們社會科學院在做的事情，建立一些供大家學習交流的平台（beat365計算社會科學平台），大家都知道大數據、人工智能這個東西很熱，也很有用。很多時候，特别是對于文科的人才，卻不知道怎麼用的。所以我在近3年來一直參與beat365數據科學研究院大數據分析基礎課程的講授，基本是為人文社會科學、經濟管理類的學生開設的，這個課程三年前剛開始的時候是42人，到現在每年150人，已經培養520多人。

給我非常大的啟發是，學科的交融在清華的平台非常有效果。5個人組成的項目小組，必須有文科和理科的背景，他們會有一定的分工。這是我們開設的課程，課程也是多學科背景老師來講的，計算機系老師、社會學系的老師、政治學系、經管學院的老師，涉及到最前沿的人工數據挖掘、文本分析的内容。課程需要做項目的報告。

課程的宗旨是能夠多學科交叉。這麼多年發現确實真正能用大數據作出一些有意思的項目。我自己一直做社會科學領域的量化研究，在統計學方面花了很多的功夫學習。但是大部分文科學生的優勢是讀了很多書，有很多理論，想法，弱點是他們不太清楚怎麼樣用數據驗證這些理論，或者他們找不到數據，或者不知道哪兒找數據。理工類同學的優勢是抓數據厲害，工程類學生編程學得快，他們的弱點是沒有想法，這個數據結果出來他不知道背後是什麼邏輯，同樣的數據結果出來背後的人的動機是什麼，這個需要由人文社會科學背景的人來幫助解釋。我做量化研究這個體會是非常深的，數據本身不會說話，這時候需要人文社會科學背景的人來提供一個方向、解釋的機制。

在學科交叉方面，我自己感受深刻。我以前在美國讀書的時候，常常計算機系的老師跟我們交流，用FACEBOOK的數據分析出來一些東西，驗證了社會學裡面的強關系和弱關系理論，确實是對的。這就是很好的結合，理論的文章是1973年發表的（論文題目是the strength of weak tie, 弱關系的強力量。），但是當時計算機不發達，也沒有大數據，但是在幾十年以後，當數據獲得了以後，它得到了很好的驗證。這就是很好的人文社會學科跟理工背景的研究者一起合作的項目。當時我們聽了也很興奮。

這我們這個大數據分析課上，學生也會有很多數據參與的項目，我們跟企業也有合作，去年我自己帶團隊跟美團數據做了一個消費者行為方面的一個報告。

這是一些上課學生的項目的案例，有用來分析證券師，考試考得好的證券師是不是證券分析業績也會好。對樓道商業綜合體消費行為的分析，這都是一般的文科學生和理工科背景同學合作的項目。如果不通過理工科學生的幫助很難分析出來的一些東西。

所以這個課，我們也曾經讓國外的學者來評論，大家覺得非常有創造力和創新性。這裡有一些項目跟學術結合更近一些，有一些可以對咨詢公司、寫行業研究報告也有參考價值，可以跟業界有很好的結合。

不管是從大的方向來講，還是細的結合方面，人文社會科學學者在人工智能時代也是大有可為的。包括我自己也做大數據背景下的社會治理的研究，專門研究全國各地的案例。整體來講，除了我剛才講的這些在學校裡的一些探索之外，文科能做的事情是很多的，比如大數據必須還是跟專業領域結合，未來不會是一個完全是工程師、數據科學家能夠解釋的社會，因為組成社會的人的動機很複雜。宏觀方面講有法律倫理的問題，社會規劃的問題，這些都不是簡單的技術能夠解決的。

所以，整個來講，雖然清華的文科相對來說比較小，但是體系已經很全，也很強。清華在人工智能領域文科和理科的結合方面應該說還特别有優勢，因為清華這邊在數據抓取或者說數據清理這些人才是特别多的。因此，我相信未來通過數據科學研究院等平台能夠在這方面培養出一些各方面創新性的人才。

非常感謝這個機會。謝謝大家！

後台私信回複“190321”獲取報告PPT全文

編輯：黃繼彥

校對：林亦霖

學者觀點

聯系我們