目前人工智能已成業(yè)界熱議話題,人工智能對實體經(jīng)濟(jì)、虛擬經(jīng)濟(jì)都有巨大的推動作用,同時人工智能對于金融、證券業(yè)而言也有較大的應(yīng)用空間。本文嘗試提出人工智能所帶來的經(jīng)濟(jì)社會形態(tài)的本質(zhì)內(nèi)涵,并提出與實體經(jīng)濟(jì)深度融合的專用人工智能技術(shù)體系。
數(shù)字經(jīng)濟(jì)是人工智能經(jīng)濟(jì)的前提
人工智能經(jīng)濟(jì)形態(tài)是數(shù)字經(jīng)濟(jì)之后新的經(jīng)濟(jì)形態(tài),它建立在數(shù)字化、互聯(lián)網(wǎng)化、信息化基礎(chǔ)上,且人工智能技術(shù)的發(fā)展之所以三起三落,與每個階段數(shù)字經(jīng)濟(jì)發(fā)展的不充分有直接關(guān)系。如圖所示,每個科技與經(jīng)濟(jì)發(fā)展階段都要以上一個階段為基礎(chǔ),如果上一個階段整體發(fā)展不充分,那么本階段的發(fā)展就會缺乏基礎(chǔ),出現(xiàn)“往復(fù)式發(fā)展現(xiàn)象”。同時,人工智能在各個行業(yè)的發(fā)展不均衡,某個行業(yè)會出現(xiàn)先例,例如在棋藝方面,國際象棋、圍棋已經(jīng)被人工智能攻克,在該領(lǐng)域已經(jīng)沒有人類可以超越“深藍(lán)”“AlphaGo Zero”。
圖 科技進(jìn)步與經(jīng)濟(jì)形態(tài)關(guān)系RSE模型
人工智能的內(nèi)核是計算機(jī)技術(shù),通過基礎(chǔ)資源(即數(shù)字經(jīng)濟(jì)階段的技術(shù)積累)、物理世界的數(shù)字化(包括特征化、向量化、標(biāo)簽化)、互聯(lián)網(wǎng)和信息化(包括大數(shù)據(jù)服務(wù)、云化信息系統(tǒng))三步,人工智能才能更好地在具體領(lǐng)域有學(xué)習(xí)、智能升級的基礎(chǔ)。因此當(dāng)人們在模仿人類大腦開發(fā)人工智能、研究卷積神經(jīng)網(wǎng)絡(luò)、開發(fā)深度學(xué)習(xí)上遇到瓶頸,可反向在數(shù)字經(jīng)濟(jì)發(fā)展是否充分方面尋找答案。
專用人工智能發(fā)展階段,技術(shù)體系與實體經(jīng)濟(jì)融合
技術(shù)體系指各種技術(shù)之間相互作用、相互聯(lián)系,并按一定目的、一定結(jié)構(gòu)方式組成的技術(shù)整體。人工智能是一個技術(shù)簇,尤其是在專用人工智能階段需要加強(qiáng)技術(shù)分類,因為人工智能的技術(shù)分類是人工智能技術(shù)體系形成的基礎(chǔ)。
人工智能狹義上可理解為通過人工的手段達(dá)到模仿人類智能的目標(biāo)。智能主要表現(xiàn)在人工智能的技術(shù)發(fā)展定位上,而人擁有視覺、聽覺、觸覺、味覺、感覺、語言表達(dá)、書寫、行動、邏輯推理、學(xué)習(xí)、記憶等能力。當(dāng)人工智能具備了其中某項能力,代替人來做具體崗位上重復(fù)的體力或腦力勞動,這便是專用人工智能。專用人工智能是可以標(biāo)準(zhǔn)化的,簡單、重復(fù)的勞動形式。本文將專用人工智能階段技術(shù)體系歸為十大類,見表。
表 專用人工智能階段應(yīng)用技術(shù)分類
語言識別技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
語言識別是機(jī)器人與人類通過聲音交互的前提,包括語言種類識別、口音的處理、背景噪聲、區(qū)分同音異形/異義詞、典型應(yīng)用領(lǐng)域醫(yī)療聽寫、語音書寫、電腦系統(tǒng)聲控、電話客服等。
語言識別技術(shù)與實體經(jīng)濟(jì)融合的領(lǐng)域包括以下幾個方面。
一是提升各類電子設(shè)備附加值,通過嵌入自然語言處理技術(shù),使各類電子設(shè)備具備自然語言控制、簡單對話功能,增加國內(nèi)產(chǎn)品出口競爭力,如智能終端、白色家電、導(dǎo)航設(shè)備等。
二是提升各類產(chǎn)品與服務(wù)在線響應(yīng)感知,通過自然語言處理技術(shù)、預(yù)設(shè)的邏輯導(dǎo)引,可以實現(xiàn)7×24小時在線電商服務(wù),實現(xiàn)智能問答型自動客服,可廣泛應(yīng)用于運營商客服、電商客服、地產(chǎn)營銷客服等各類客戶服務(wù)系統(tǒng)。
三是各類現(xiàn)場服務(wù)機(jī)器人,現(xiàn)場服務(wù)機(jī)器人最重要的是人機(jī)交互,要能準(zhǔn)確理解現(xiàn)場客戶的需求,這方面的應(yīng)用非常廣泛,幾乎涉及到所有服務(wù)行業(yè),典型應(yīng)用場景如酒店、餐飲、娛樂等服務(wù)場所。
四是其他領(lǐng)域,可以用于身份認(rèn)證、保密管理、金融遠(yuǎn)程登錄密碼和聲紋雙保險、軍事領(lǐng)域聲紋識別偵聽模塊等領(lǐng)域。
語言表達(dá)技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
在語言表達(dá)技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域,語言表達(dá)與自然語言識別是機(jī)器人技術(shù)需求的兩個方面,自然語言識別從本質(zhì)上是聲紋處理技術(shù),語言表達(dá)依靠的是語言合成技術(shù),但在情感、情緒上還需要與人工智能的情緒感知技術(shù)進(jìn)行結(jié)合,包括在提高合成語音的自然度、豐富合成語音的表現(xiàn)力、降低語音合成技術(shù)的復(fù)雜度、多語種語音合成等方面還有待改進(jìn)。
在各類聲音播報的商業(yè)場景上,聲音模仿技術(shù)可以模仿任何聲音紋理。比如世界首部利用人工智能模擬人聲的紀(jì)錄片《創(chuàng)新中國》在央視紀(jì)錄片頻道播出,紀(jì)錄片解說詞全程運用人工智能配音,“重現(xiàn)”已故配音大師李易的聲音;地圖導(dǎo)航系統(tǒng)可以模仿任一明星的聲紋進(jìn)行全程播報。通過錄制一段聲音可實現(xiàn)文本的自動播報幾乎適用于所有聲音播報商業(yè)場景。
在服務(wù)機(jī)器人領(lǐng)域,服務(wù)機(jī)器人的語言表達(dá)決定了機(jī)器人與人交互的順暢度、親和力、自然程度。服務(wù)機(jī)器人體現(xiàn)的是人工智能的第二個發(fā)展階段——通用人工智能。
語義理解技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
語義理解本質(zhì)上就是文本理解技術(shù),它是聲音識別的輸出,同時也是語言表達(dá)、邏輯推理、深度學(xué)習(xí)、行為技術(shù)的分析輸入,文本就是數(shù)據(jù),數(shù)據(jù)就是符號。數(shù)據(jù)本身沒有任何意義,只有被賦予含義的數(shù)據(jù)才能被使用,這時候數(shù)據(jù)就轉(zhuǎn)化為信息,而數(shù)據(jù)的含義就是語義。語義理解技術(shù)分為詞匯級、句子級、篇章級3個方向,該行業(yè)需要大量的機(jī)器學(xué)習(xí)素材,因此大型公司往往采用開源的形式發(fā)布相關(guān)技術(shù)模塊,例如谷歌發(fā)布了解析器SyntaxNet,科大訊飛發(fā)布了訊飛開放平臺。
在手機(jī)終端上,手機(jī)終端在數(shù)字經(jīng)濟(jì)時代是移動互聯(lián)網(wǎng)的載體,在人工智能時代是人類活動的助理機(jī)器人;移動互聯(lián)網(wǎng)流量在整個互聯(lián)網(wǎng)中占比在2018-2019年將超過60%。Gartner預(yù)測,2018年后AI智能終端的出貨量占比將會逐年提升,2020年全球手機(jī)出貨量將達(dá)25.5億部,其中AI移動智能終端將達(dá)到13.3億部,占比52.1%,當(dāng)前智能手機(jī)的發(fā)展方向?qū)⑹侨斯ぶ悄苁謾C(jī)。
在大型會議記錄、翻譯中,速記、同聲傳譯是必不可少的,隨著語音識別技術(shù)的開發(fā),當(dāng)前語音同聲語音轉(zhuǎn)文字服務(wù)、機(jī)器人自動轉(zhuǎn)譯技術(shù)已接近成熟,商用化翻譯產(chǎn)品已在2016年推向市場。
在大數(shù)據(jù)行業(yè)應(yīng)用中,大數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),當(dāng)前結(jié)構(gòu)化數(shù)據(jù)可以通過成熟的數(shù)據(jù)分析工具處理,但是非結(jié)構(gòu)化數(shù)據(jù)一直是難點,根本原因是語義理解問題,如語義理解成熟化問題。人工智能文本語義理解技術(shù)可以根據(jù)一個自有命題從互聯(lián)網(wǎng)網(wǎng)頁、電子書中搜集數(shù)據(jù),形成新的高水平、濃縮人類所有數(shù)字世界智慧成果的著作、論文,非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用將達(dá)到質(zhì)的飛躍。
視覺技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
人工智能領(lǐng)域的視覺技術(shù)主要是圖像識別、計算機(jī)視覺、機(jī)器視覺。雖然機(jī)器視覺在工業(yè)領(lǐng)域被廣泛提及,但是其應(yīng)用的技術(shù)包括了計算機(jī)視覺、圖像處理等技術(shù),應(yīng)用場景也稍有不同。圖像識別主要應(yīng)用在圖像采集終端,如人臉識別攝像頭;計算機(jī)視覺主要是應(yīng)用于動態(tài)圖像的分析和靜態(tài)圖像分析。可以說,計算機(jī)視覺是人工智能視覺技術(shù)的基礎(chǔ)元素。
視覺技術(shù)是人工智能當(dāng)前技術(shù)相對其他技術(shù)領(lǐng)域較成熟、技術(shù)發(fā)展最快、市場需求量最大的領(lǐng)域,比如人臉識別,在光線好的情況下,正面人臉識別機(jī)器的準(zhǔn)確率能達(dá)到99.99%,人臉識別在公安、物業(yè)安保、銀行、證券、金融社保、教育、電子商務(wù)、機(jī)場、地鐵等場景應(yīng)用廣泛。前瞻研究院《中國人臉識別行業(yè)市場前瞻與投資戰(zhàn)略規(guī)劃分析報告》顯示,未來十年,我國人臉識別行業(yè)市場規(guī)模有望達(dá)到千億元。
視覺技術(shù)另外一個巨大市場是醫(yī)療領(lǐng)域。以肺結(jié)節(jié)檢測為例,一家三甲醫(yī)院平均每天接待200例左右的肺結(jié)節(jié)篩查患者,每位患者在檢查環(huán)節(jié)會產(chǎn)生200~300張左右的CT影像,放射科醫(yī)生每天至少需要閱讀4萬張影像,任務(wù)繁重,消耗大量精力,導(dǎo)致誤診漏診率上升。中國醫(yī)學(xué)會的一份誤診數(shù)據(jù)資料顯示,中國臨床醫(yī)療總誤診率為27.8%,其中惡性腫瘤平均誤診率為40%,國內(nèi)醫(yī)學(xué)影像資源匱乏,且存在結(jié)構(gòu)性失衡,帶來第三方影像中心發(fā)展機(jī)遇。開發(fā)醫(yī)療行業(yè)圖像識別技術(shù),促進(jìn)行業(yè)專用設(shè)備發(fā)展,如能在社會基層醫(yī)療機(jī)構(gòu)普及,將大大提升分級診療效率、促進(jìn)醫(yī)療資源公平,對于醫(yī)療領(lǐng)域放射科、病理科室而言,從市場需求和技術(shù)需求的角度來看均比較緊迫。
在國家衛(wèi)生計生委、安徽省衛(wèi)計委的指導(dǎo)下,科大訊飛與清華大學(xué)聯(lián)合研發(fā)的人工智能“智醫(yī)助理”機(jī)器人在國家醫(yī)學(xué)考試中心監(jiān)管下參加了2017年臨床執(zhí)業(yè)醫(yī)師綜合筆試測試,“智醫(yī)助理”456分的成績處于全國53萬名考生中的中高級水平,未來技術(shù)越來越成熟。從輔助醫(yī)療到專項醫(yī)療機(jī)器人,人工智能技術(shù)將促進(jìn)我國醫(yī)療體制改革的落地。
圖像繪制技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
圖像繪制就是人工智能開展圖像創(chuàng)作,在與設(shè)計相關(guān)的領(lǐng)域中應(yīng)用廣泛,如工程圖紙設(shè)計、工業(yè)設(shè)計、工藝品設(shè)計等,可大大節(jié)省設(shè)計人員的的工作量,提升工作效率,提高準(zhǔn)確度。
圖像繪制是將數(shù)字世界與物理世界進(jìn)行映射,由物理世界輸入到數(shù)字世界,或者由數(shù)字世界通過紙張、3D打印等呈現(xiàn)給物理世界,在這個過程增加人工智能就可以代替人的部分或全部勞動。圖像繪制不僅可以繪制圖像,它在精密IC電路板制造、外科手術(shù)領(lǐng)域也有較好應(yīng)用前景。
行為技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
機(jī)器人行為技術(shù)是未來行動型通用、超級人工智能的前提,應(yīng)用范圍大致分為工業(yè)機(jī)器人、礦業(yè)機(jī)器人、建筑機(jī)器人、交通機(jī)器人、服務(wù)機(jī)器人、應(yīng)急救災(zāi)機(jī)器人、軍用機(jī)器人等,凡是人類四肢動作的勞動均可以通過機(jī)器人來實現(xiàn)。
工業(yè)機(jī)器人最先在汽車行業(yè)普及,現(xiàn)在正在向家電制造行業(yè)、醫(yī)藥制造行業(yè)、物流行業(yè)普及。2018年中國工業(yè)機(jī)器人市場規(guī)模達(dá)到22.3億美元,未來五年(2018-2022年)年均復(fù)合增長率約為22.73%,2022年中國工業(yè)機(jī)器人市場規(guī)模將達(dá)到50.6億美元。當(dāng)前工業(yè)機(jī)器人將加入機(jī)器視覺技術(shù),使其成為通用機(jī)器人可以不用更改生產(chǎn)線機(jī)器臂軌跡參數(shù)而實現(xiàn)自主流水線生產(chǎn)。
我國物流行業(yè)已經(jīng)能夠?qū)崿F(xiàn)從港口、倉庫到快遞派送的無人化(結(jié)合遠(yuǎn)程控制),如上海的洋山港、山東青島港的全自動化港口;大型物流公司已基本普及AGV搬運機(jī)器人;某大型電商已在北京試點無人派送小車。
交通機(jī)器人分為無人駕駛客運專用車、物流專用車兩大類,客運專用車以無人駕駛小汽車為主,無人駕駛將給整個交通、物流產(chǎn)業(yè)帶來飛躍式發(fā)展。
總之,人工智能行為技術(shù)帶來的行業(yè)產(chǎn)值將有力支撐國家整個人工智能產(chǎn)業(yè)“三步走”目標(biāo)的實現(xiàn),極大地降低人口老齡化、人工成本上升帶來的產(chǎn)業(yè)勞動力問題,實現(xiàn)由人口紅利向機(jī)器紅利轉(zhuǎn)變。
觸覺感知技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
觸覺可以感知位置、力度、溫度、幅度等人手要做的精細(xì)事務(wù),相對于行為技術(shù),人工智能觸覺感知技術(shù)應(yīng)用在身體感知需要比較細(xì)膩的應(yīng)用領(lǐng)域。
在醫(yī)療行業(yè)應(yīng)用上,要做虛擬手術(shù)、遠(yuǎn)程醫(yī)療,就必須有觸覺,比如專家遠(yuǎn)程手術(shù)、人造皮膚傳感技術(shù)已在實驗室實現(xiàn),是未來服務(wù)機(jī)器人的皮膚雛形。
在陪護(hù)行業(yè)應(yīng)用上,隨著中國老齡化人口的增加,養(yǎng)老、康復(fù)照料問題是社會共同面臨的難題,康復(fù)工成本逐年上升,陪護(hù)機(jī)器人的市場空間很大,其功能需求包括服務(wù)、安全監(jiān)護(hù)、人機(jī)交互以及多媒體娛樂等。
推理技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
推理技術(shù)包括常識推理、計算推理、邏輯推理、倫理推理等。常識推理指的是機(jī)器在沒有任何背景學(xué)習(xí)情況下進(jìn)行常識的推理。對于對話機(jī)器人來說,推理是實現(xiàn)智能對話的技術(shù)基礎(chǔ),但當(dāng)前這項技術(shù)還遠(yuǎn)不夠成熟。谷歌、蘋果、微軟、百度、科大訊飛的對話型機(jī)器人都在向這個目標(biāo)努力,讓機(jī)器具備基本的推理、學(xué)習(xí)相關(guān)的計算能力、邏輯能力,而AlphaGo就是這個層次的典型應(yīng)用。
推理技術(shù)根據(jù)具體領(lǐng)域的標(biāo)準(zhǔn)化規(guī)則可以在專用人工智能領(lǐng)域發(fā)揮到智慧的極致,將若干推理技術(shù)疊加在一起為未來的通用人工智能打下了基礎(chǔ)。未來可以實現(xiàn)軟件開發(fā)的人工智能化,即由人工智能來開發(fā)軟件。這對于我國2017年1.7萬億人民幣產(chǎn)出規(guī)模的軟件產(chǎn)業(yè)來說無異于再造一個軟件產(chǎn)業(yè),而軟件工程師的主要工作將變成開發(fā)人工智能自動開發(fā)軟件。
推理技術(shù)還有一項重要領(lǐng)域就是人工智能操作系統(tǒng),與數(shù)字經(jīng)濟(jì)時代類似,人工智能也需要有統(tǒng)一、開源的操作系統(tǒng)來承載專用人工智能,使各種人工智能軟件能夠在一個開放的架構(gòu)下實現(xiàn)互相調(diào)用。它與當(dāng)前的Windows、安卓、iOS系統(tǒng)不同,人工智能操作系統(tǒng)本身就具有自我迭代、自我完善的能力。
情緒感知技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
情緒感知技術(shù)是通用型服務(wù)機(jī)器人的基礎(chǔ),包括識別情緒和表達(dá)情緒兩個方向。眾所周知,人們對幸福生活的追求不僅是物質(zhì)上的,還有精神上的,情緒感知技術(shù)讓機(jī)器人增加了與人的互動,讓人們對機(jī)器人產(chǎn)生親切感,人工智能不僅是人類勞動的替代者,更是人類的伙伴。人工智能情緒識別的能力用處極大,在醫(yī)療業(yè)、服務(wù)業(yè)甚至審訊領(lǐng)域都會發(fā)揮不小的作用,很多世界頂尖的研究機(jī)構(gòu)都在進(jìn)行這方面的研究,如卡耐基梅隆大學(xué)機(jī)器人研究所Torre發(fā)明的面部識別軟件IntraFace可以幫助醫(yī)生檢測抑郁癥。
在當(dāng)前實體經(jīng)濟(jì)應(yīng)用領(lǐng)域,可以從簡單入手,例如應(yīng)用于交通運輸領(lǐng)域識別大巴車、監(jiān)測物流貨運車司機(jī)是否疲勞駕駛;適用于教育領(lǐng)域?qū)W生在課堂上的注意力情況統(tǒng)計等。
機(jī)器學(xué)習(xí)技術(shù)與實體經(jīng)濟(jì)融合領(lǐng)域
機(jī)器學(xué)習(xí)是人工智能技術(shù)體系的一個通用環(huán)節(jié),機(jī)器學(xué)習(xí)使用歸納、綜合方法,運用數(shù)據(jù)導(dǎo)入算法模仿人類智能。學(xué)習(xí)方式主要分為有數(shù)據(jù)學(xué)習(xí)和無數(shù)據(jù)學(xué)習(xí):當(dāng)前有數(shù)據(jù)學(xué)習(xí)顯然廣受歡迎,包括“監(jiān)督學(xué)習(xí)”“無監(jiān)督學(xué)習(xí)”“半監(jiān)督學(xué)習(xí)”“深度學(xué)習(xí)”“遷移學(xué)習(xí)”等;無數(shù)據(jù)學(xué)習(xí)法主要為“強(qiáng)化學(xué)習(xí)”。有數(shù)據(jù)學(xué)習(xí)的典型應(yīng)用為深度學(xué)習(xí),深度學(xué)習(xí)包括DNN(深度神經(jīng)網(wǎng)絡(luò))、CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))和LSTM(長短期記憶網(wǎng)絡(luò))等,它不依賴數(shù)字經(jīng)濟(jì)的發(fā)展,而是由人做數(shù)據(jù)標(biāo)簽,采用神經(jīng)網(wǎng)絡(luò)算法,學(xué)習(xí)效率不高、能源資源浪費,如AlphaGo下場棋要消耗3000美元電費。
強(qiáng)化學(xué)習(xí)只需要人類輸入規(guī)則,機(jī)器就能通過自我獎勵、自我誘導(dǎo)方式,跟自己下百萬盤棋,不斷自我完善,AlphaGo Zero三天內(nèi)就打敗了已經(jīng)學(xué)習(xí)了幾千盤棋的AlphaGo;數(shù)字技術(shù)發(fā)展越好、標(biāo)準(zhǔn)化數(shù)據(jù)量越大的領(lǐng)域往往人工智能發(fā)展越迅速,這就說明機(jī)器的學(xué)習(xí)能力不是人為訓(xùn)練的結(jié)果,而是數(shù)字經(jīng)濟(jì)發(fā)展到一定階段順其自然的結(jié)果。從使用場景上來說,有數(shù)據(jù)學(xué)習(xí)適用于規(guī)則活動領(lǐng)域的人工智能,是經(jīng)驗、控制使然;無數(shù)據(jù)學(xué)習(xí)適用于創(chuàng)新、無定論的領(lǐng)域,比如棋類競賽、新藥探索、藝術(shù)創(chuàng)作等,是創(chuàng)新、自由使然。
因此當(dāng)前我國發(fā)展機(jī)器學(xué)習(xí),需要從數(shù)字技術(shù)發(fā)展基礎(chǔ)好、標(biāo)準(zhǔn)化數(shù)據(jù)量大的相關(guān)實體經(jīng)濟(jì)領(lǐng)域著手,如人口管理、交通、醫(yī)療、教育、數(shù)控制造等領(lǐng)域。
伴隨著數(shù)字經(jīng)濟(jì)的發(fā)展人工智能技術(shù)從提出到現(xiàn)在已經(jīng)有60多年歷史,以人工智能為主線發(fā)展實體經(jīng)濟(jì)將給我國帶來“彎道超車”的絕佳機(jī)遇。
摘自(中機(jī)聯(lián))