人類的技能的基本就是把知識(shí)能聯(lián)系起來(lái),能把所有的技能聯(lián)系起來(lái),然后加以應(yīng)用和加以分享,能學(xué)習(xí),能比較。
9月15日,在由中國(guó)人工智能學(xué)會(huì)學(xué)術(shù)指導(dǎo)的全國(guó)博士后學(xué)術(shù)交流活動(dòng)上,歐洲科學(xué)院院士,深知無(wú)限人工智能研究院(AITC)院長(zhǎng)、首席科學(xué)家,德國(guó)人工智能研究中心(DFKI) 科學(xué)董事,聯(lián)想研究院AI首席顧問(wèn)漢斯·烏思克爾特發(fā)表了題為“Combining different types of machine learning for information and knowledge extraction”的演講。
下為漢斯·烏思克爾特院士在本次大會(huì)中的演講實(shí)錄,經(jīng)整理后發(fā)布。
漢斯·烏思克爾特:非常感謝李教授,我非常喜歡他的演講,可以說(shuō)講的非常好,他談到了愿景和現(xiàn)實(shí)也有很好的結(jié)合,在我的演講里面我也盡量現(xiàn)實(shí)一點(diǎn),跟大家分享一下我個(gè)人的經(jīng)驗(yàn),特別是在機(jī)器學(xué)習(xí)的應(yīng)用方面,以及建立知識(shí)架構(gòu)方面,我希望能夠做到至少有一點(diǎn)遠(yuǎn)見。我們知道有廣義的和窄義的AI,在今天的AI我們稱為窄義上的AI,因?yàn)槲覀冎繟I能開車,能識(shí)別人臉,能翻譯,能下圍棋,通常同樣一個(gè)AI的模型不能做很多的事情,但是人類是不同的,人類可以做各種完全不同的事情。
現(xiàn)在讓我們?cè)倏匆幌職v史,看一下這兩種系統(tǒng),一個(gè)系統(tǒng)是做窄面的事情,可以反映有很長(zhǎng)的歷史,還有其他的系統(tǒng),他們擁有知識(shí),能夠去做不止一件事,可以做很多事情。所以在一開始,我們?cè)跈C(jī)器學(xué)習(xí)開始的時(shí)候,在AI系統(tǒng)一開始是基于標(biāo)準(zhǔn),基于規(guī)則的,我們可以檢查一個(gè)人是否能夠獲得相應(yīng)的信用卡,要檢查他的信用情況等等,所以基于知識(shí)的AI。我們還有一些機(jī)器人,我們可以給他編程,像人類一樣做事情,這就是初期的AI,機(jī)器人可以去解決一些問(wèn)題,遇到障礙可以停下來(lái),這是把程序作為一個(gè)流程來(lái)安排的。
那么機(jī)器人也是有知識(shí)的,四處移動(dòng),一開始這些東西都是編號(hào)成序的,還有另外的一些方面,一方面是谷歌翻譯,可以翻譯成很多句子,即使他不理解其中的意思,也可以做到這點(diǎn),對(duì)人類來(lái)講無(wú)法做到,我們只能在理解之后進(jìn)行翻譯,但是谷歌的機(jī)器翻譯可以翻譯這些內(nèi)容,模仿人類,就像自動(dòng)駕駛一樣,模仿人類駕駛來(lái)進(jìn)行。另外機(jī)器識(shí)別,機(jī)器識(shí)別不用理解所說(shuō)話的意思,無(wú)論講什么內(nèi)容但是可以去識(shí)別。另外有IBM watson系統(tǒng),也打敗了美國(guó)智力挑戰(zhàn)的專家,它是信息量豐富的,也是非常神奇的一個(gè)系統(tǒng)。IBM有一些人類挑戰(zhàn)賽的冠軍,IBM可以做到把圣經(jīng),把維基百科,把這些知識(shí)存儲(chǔ)到里面去,watson可以使用。
當(dāng)然還有其他的系統(tǒng),可以從人類的回答里進(jìn)行分析,可以去模仿人類,就像小的鸚鵡一樣可以重復(fù)人類所說(shuō)的知識(shí)。還有一些能學(xué)習(xí)的類似于機(jī)器人,像德國(guó)的DFKI的系統(tǒng),我們也討論很多,它也有很多的來(lái)自于大數(shù)據(jù)的知識(shí)。這些系統(tǒng)也使用一些機(jī)器學(xué)習(xí),逐漸擴(kuò)大知識(shí),也同樣在內(nèi)部使用深度學(xué)習(xí),深度學(xué)習(xí)也是非常強(qiáng)大的,需要讓它做很多事情,即使需要很大的知識(shí)量。人類的智能,在不同人類的技能也是相互聯(lián)系的,比如說(shuō)當(dāng)我游泳的時(shí)候,這和我的識(shí)別別人人臉的功能是完全不相連的,人類的技能可以互相分開的,但是需要完全不同的知識(shí),我能夠把不同的知識(shí)和技能應(yīng)用在不同的活動(dòng)上面,比如我騎自行車向左轉(zhuǎn),我可以用一只手掌握車把,或者走一個(gè)曲線的路子。翻譯的時(shí)候我可以翻譯,我可以識(shí)別人臉,比如說(shuō)在座的各位里面,我找出膚色白和膚色稍黑的人,這也是需要一定的技能。
這是不同的技能,我們可以把所有的技能都綜合起來(lái),所以人類的技能的基本就是把知識(shí)能聯(lián)系起來(lái),能把所有的技能聯(lián)系起來(lái),然后加以應(yīng)用和加以分享,能學(xué)習(xí),能比較。下面讓我很快過(guò)一下這些內(nèi)容,我們都知道這些內(nèi)容,我們知道在指導(dǎo)下的學(xué)習(xí),我們有各種各樣的數(shù)據(jù),還有一些沒(méi)有監(jiān)督的或者沒(méi)有指導(dǎo)下的自主學(xué)習(xí),還有非常重要的就是這種半指導(dǎo)性下的學(xué)習(xí)有很多方法,比如說(shuō)我們把一些數(shù)據(jù)予以標(biāo)記,可以去進(jìn)行分析,然后有些數(shù)據(jù)不用有太多的標(biāo)記,這樣我們就可以去減輕人類的工作強(qiáng)度。還有一種叫做較少指導(dǎo)下的學(xué)習(xí),我們很少有例子,這些例子能被標(biāo)識(shí)。我們用非常好的數(shù)據(jù),這樣機(jī)器能找到更多的類似的數(shù)據(jù)根據(jù)標(biāo)簽,這樣可以進(jìn)行更多的學(xué)習(xí),更好的建造學(xué)習(xí)架構(gòu)。
機(jī)器可以自動(dòng)加標(biāo)記,因?yàn)橐呀?jīng)有這些數(shù)據(jù)了。還有機(jī)器性的學(xué)習(xí),我們都知道機(jī)器的學(xué)習(xí),這些系統(tǒng)能夠意識(shí)到有些數(shù)據(jù)是缺失的,他們可以去尋求這些數(shù)據(jù),或者說(shuō)文字我不認(rèn)識(shí),請(qǐng)給我翻譯一下,因?yàn)槿鄙倮樱憧梢越o我更多的例子,更多的數(shù)據(jù),作為機(jī)器性的學(xué)習(xí)。第二個(gè)就是強(qiáng)化學(xué)習(xí),剛才李教授提到了,也就是獲得強(qiáng)化學(xué)習(xí)的閉環(huán)。那么還有就是機(jī)器學(xué)習(xí),也就是機(jī)器教授,可能我們稱之為課程學(xué)習(xí),大家都有一種觀念就是把數(shù)據(jù)進(jìn)行分離開來(lái),把它們成為更簡(jiǎn)單的數(shù)據(jù)和更困難的數(shù)據(jù),可能對(duì)于孩子會(huì)給他們更簡(jiǎn)單的數(shù)據(jù),隨著他們的成長(zhǎng),要給他們更困難的數(shù)據(jù),所以這是一種很簡(jiǎn)單的方式。這樣的方式當(dāng)中,我們就可以進(jìn)行難度的增加,所以這叫做課程的學(xué)習(xí)。
實(shí)際上在我們的程序語(yǔ)言處理當(dāng)中,我們不知道其他的方面或者是領(lǐng)域,如果說(shuō)你是通過(guò)一個(gè)簡(jiǎn)單的物體開始,那我們就有不同的學(xué)習(xí)分層,或者是不同的目標(biāo)區(qū)分,也是從最簡(jiǎn)單的開始,然后大家會(huì)展示他們的一些積極的學(xué)習(xí)成果,這可能就是機(jī)器的教授。教授是一層,然后機(jī)器是另一層,我們就把它加入整合起來(lái),就是機(jī)器教授。那我們來(lái)講授一下這種應(yīng)用,機(jī)器人和自動(dòng)駕駛的區(qū)別是什么?其實(shí)我們現(xiàn)在所說(shuō)的AI是非常狹義的概念,比如說(shuō)智能汽車以及其他各個(gè)領(lǐng)域的應(yīng)用,但其實(shí)對(duì)于AI技術(shù)非常關(guān)鍵的一點(diǎn)就是幫助人們做決定。我們知道現(xiàn)在的數(shù)據(jù)非常龐雜,我們的大腦也是有限的,我們并不能處理這么龐雜的數(shù)據(jù),其中的一個(gè)例子就是公司智能,那我們可以看到在公司智能中間部分,就是我們要運(yùn)用新的AI技術(shù),來(lái)為我們提供平臺(tái),幫助公司做決定。
那我們可以看到CIA,也就是中情局,可能和情報(bào)局是不一樣的,那在英國(guó)我們?cè)谟⒄Z(yǔ)當(dāng)中,我們情報(bào)和智能是一個(gè)詞,但是在中國(guó)智能實(shí)際上和情報(bào)是不一樣的,我們?cè)谶@里強(qiáng)調(diào)的是智能。在德國(guó)也是,我們是有兩個(gè)不同的單詞,那現(xiàn)在企業(yè),非常重要的一個(gè)觀點(diǎn),其實(shí)讓企業(yè)獲得成功的方面是在公司之外的,大家在工廠當(dāng)中,就是我們收入的來(lái)源,就是客戶支付錢,如果我們沒(méi)有技術(shù)來(lái)支撐的話,或者是說(shuō)我們的客戶,我們的供應(yīng)商沒(méi)有給我們提供足夠的原料,或者是我們的投資者并沒(méi)有為我們持續(xù)的投資,而出售了我們的股份,或者是我們的分銷商并沒(méi)有繼續(xù)分銷我們的產(chǎn)品,這就會(huì)給公司造成損失。
現(xiàn)在作為一個(gè)中國(guó)的公司,我們可能有兩萬(wàn)或一萬(wàn)的人,而且我們將商品出口到世界各地,其實(shí)很多的供應(yīng)商不在中國(guó),而且一些客戶也可能是在非洲和法國(guó),我們的競(jìng)爭(zhēng)者可能在瑞士,所以我們?cè)趺礃觼?lái)認(rèn)知,對(duì)這些不同的成分進(jìn)行認(rèn)知呢?我們?cè)趺礃涌创@些全球化的不同的組成實(shí)體呢?那其實(shí)我們有一個(gè)夏明的工廠就找到我們來(lái)到柏林,他們來(lái)到我們的智能研究中心,可以幫助我們來(lái)監(jiān)控或者是觀察我們的客戶嗎?我不知道我們的產(chǎn)品的什么特征他們會(huì)喜歡,我們的客戶喜歡什么樣的產(chǎn)品,比如西班牙,他們說(shuō)不同的語(yǔ)言,所以我不知道他們需求是什么。如果我們把這寫都整合起來(lái),就是一個(gè)智能企業(yè)。那其實(shí),中情局也是同樣的道理,并不是說(shuō)作出最終決定,他們是得到這些所有的信息來(lái)幫助他們作出選擇。
我們并不是說(shuō)使用人工智能來(lái)取代人,當(dāng)然了在很多領(lǐng)域,AI能取代人的功能,但是我們現(xiàn)在能給人們賦權(quán),能讓人更好的作出決定,更好的輔助他們的工作。那在行業(yè)當(dāng)中,我們可以通過(guò)人工智能幫助人作出更加明智的決定,比如在一些領(lǐng)域,他們是不能取代專家的產(chǎn)品經(jīng)理或者是市場(chǎng)調(diào)研員,因?yàn)樵谶@些領(lǐng)域,AI所起的作用是幫助他們更好的篩選和分析數(shù)據(jù),作出更具邏輯的結(jié)論和決定。所以這是我們現(xiàn)在的人工智能形式。其實(shí)有來(lái)自全世界的數(shù)據(jù),然后我們的大腦作出決定,這個(gè)決定最終會(huì)影響公司。我們的大腦從世界獲取數(shù)據(jù),同時(shí)也從公司獲取數(shù)據(jù),還有一些其他的知識(shí)以及人們自有的認(rèn)知的知識(shí),這樣我們就可以作出更加明智的決定。
這個(gè)是傳統(tǒng)科學(xué),這個(gè)部分就是我們的智能,左邊部分可以取代的,右邊部分是不可以取代的,右邊部分的作用就是幫助CEO作出更好的決定。我們所要做的就是能夠使無(wú)論是這些無(wú)架構(gòu)的或半架構(gòu)的整個(gè)系統(tǒng)聯(lián)系起來(lái),在其中當(dāng)中,我們有這些知識(shí)曲線,知識(shí)圖表,無(wú)論是谷歌,還是其他的媒介,我們希望有這些數(shù)據(jù)知識(shí)圖表,可能也是我們的大眾所使用的。那從傳統(tǒng)意義而言,公司會(huì)使用不同的產(chǎn)品以及不同的標(biāo)準(zhǔn),他們有自己的知識(shí)庫(kù),他們有自己的自主的知識(shí)產(chǎn)權(quán),自主的技術(shù)。那其實(shí)我們想要進(jìn)行數(shù)據(jù)的交換和交流,我們想有競(jìng)爭(zhēng)力,我們不想從公眾當(dāng)中復(fù)制和獲取數(shù)據(jù),因?yàn)楣姰?dāng)中有一些數(shù)據(jù)是根據(jù)技術(shù)和材料的,但是你不想獲取這些已經(jīng)現(xiàn)有的數(shù)據(jù),我們想具有競(jìng)爭(zhēng)力。
所以我們希望有這樣的一個(gè)知識(shí)社區(qū),通過(guò)這樣的事實(shí)社區(qū)提取出自己所需要的知識(shí),所以在我們德國(guó)就有一家,我們可以為公司構(gòu)建自己的知識(shí)架構(gòu)。這樣的知識(shí)架構(gòu),它并不同于我們的百科全書這樣的公眾知識(shí),那其中我們可以看到這個(gè)數(shù)據(jù)源,它是從左到右,但是并能從右到左,也就是我們能從百科當(dāng)中提取知識(shí),但并不是說(shuō)我們提取出來(lái)的知識(shí)或者數(shù)據(jù)再放到提取源當(dāng)中,是單向的,而不是雙向的。這樣大的知識(shí)數(shù)據(jù)庫(kù)當(dāng)中,我們現(xiàn)在已經(jīng)有30億的數(shù)據(jù)和DBPedia合作。
第二點(diǎn)我想說(shuō)知道了解我們的競(jìng)爭(zhēng)者或者是你的客戶,他們并沒(méi)有把產(chǎn)品的數(shù)據(jù)發(fā)給你,或者說(shuō)沒(méi)有用一種結(jié)構(gòu)式的方式告訴你們,他們所喜歡的產(chǎn)品,但是他們可能會(huì)為你的產(chǎn)品進(jìn)行評(píng)論,或者是發(fā)布了一些新聞,那可能你的競(jìng)爭(zhēng)者在面臨財(cái)務(wù)危機(jī),還有其他的情況,我們需要從龐雜的信息以及文本當(dāng)中提取有效的信息。我們提取出來(lái)這些信息,或者是話題,答案,姓名,事實(shí),實(shí)踐,觀點(diǎn),以及客戶的情緒等,那我們就通過(guò)大數(shù)據(jù)的處理方式,還有在柏林我的同事所研究出來(lái)的一種程序進(jìn)行這些信息的處理,它可以幫助我們數(shù)據(jù)形成數(shù)據(jù)流,形成點(diǎn)的形式。
那我給大家展示一下現(xiàn)在有什么樣的問(wèn)題,如果我想收購(gòu)一家公司,或者我想了解他的破產(chǎn)情況,產(chǎn)品,那其實(shí)人類有很多的方式表達(dá)同樣的觀點(diǎn),同樣的句子,比如說(shuō)一家公司收購(gòu)另一家公司,我們有很多方式表達(dá)這句話,這個(gè)很復(fù)雜。我們想要知道的就是它其中的模式,這是正確的關(guān)聯(lián)關(guān)系,綠色的就是,黑色的不感興趣,紅色就是我們想找出來(lái)的,綠色就是模式,這樣我們就能了解我們的競(jìng)爭(zhēng)者。
現(xiàn)在我們所做的就是監(jiān)管式,我們已經(jīng)取得了很多的例子,我們獲得了一些公司的圖表,它已經(jīng)存在了在知識(shí)庫(kù)當(dāng)中存在,然后我們找到這些描述公司的句子,他們的價(jià)格,還有其他的信息。比如說(shuō)2008年的并購(gòu),我們會(huì)得到相應(yīng)的信息,可能通過(guò)微軟,我們進(jìn)行語(yǔ)義分析,因?yàn)槲覀円揽腕w和主體是什么,其實(shí)這樣的程序,只知道兩個(gè)公司,并不知道誰(shuí)是采購(gòu)的,誰(shuí)是被收購(gòu)的,所以我們可以看到綠色的部分就是模式。
第二次就可以篩選綠色的部分獲得新的信息,同時(shí)我們已經(jīng)放了兩千個(gè)案例,基本上直說(shuō)有五十到兩千個(gè)案例在其中,我們就可以看到整個(gè)圖。現(xiàn)在我們來(lái)跳到下一部分,這是我們現(xiàn)在所采用的一個(gè)方式,我們?cè)谔幚碚Z(yǔ)言的時(shí)候,我們需要有不同的步驟,這是中國(guó)的排序,他們沒(méi)有空白,那我需要把它進(jìn)行分區(qū),我們需要找到每一個(gè)部分的語(yǔ)義是什么樣的,我需要找到現(xiàn)在的表達(dá)方式是什么,因?yàn)橥环N語(yǔ)義可能會(huì)有數(shù)百萬(wàn)的表達(dá)方式,但我要看一下現(xiàn)在的流行表達(dá)方式是什么,還有現(xiàn)在的組織的坐落點(diǎn)以及人所處的位置,這些都是我們的機(jī)器可以進(jìn)行學(xué)習(xí)的,比如說(shuō)在這兒,我們要利用神經(jīng)語(yǔ)言網(wǎng)絡(luò)學(xué)習(xí),大家可能知道LSTM是一種長(zhǎng)期短期的記憶系統(tǒng),它是德國(guó)所開發(fā)的。
同時(shí),我們還有使用這些監(jiān)管架構(gòu)來(lái)進(jìn)行學(xué)習(xí),以及包括數(shù)據(jù)過(guò)濾,為什么我們要進(jìn)行這方面的實(shí)施呢?因?yàn)槲覀儸F(xiàn)在對(duì)于大腦的構(gòu)造和模式,還并不知道我們只是進(jìn)行模仿,而且我們使用這種知識(shí)的方式,充滿知識(shí)的機(jī)器學(xué)習(xí)方式,那這種系統(tǒng)不止是從數(shù)據(jù)當(dāng)中學(xué)習(xí),同時(shí)也可以從外顯的知識(shí)當(dāng)中學(xué)習(xí),他們可以把語(yǔ)義和術(shù)語(yǔ)聯(lián)系起來(lái)。我們通過(guò)外圍的數(shù)據(jù)進(jìn)行篩選,有相應(yīng)的案例,那所以整個(gè)學(xué)習(xí)流程并不是從空白的方式開始的,而是基于其他人所給予我們的知識(shí),空白的知識(shí),我并不相信,所以我們需要在這個(gè)知識(shí)庫(kù)當(dāng)中放入更多的知識(shí),進(jìn)行再度學(xué)習(xí)。
這是一種分階段式的學(xué)習(xí),那我們?cè)俑蠹曳窒硪幌挛覀兊挠^點(diǎn)就是通過(guò)把隱性知識(shí)和外顯知識(shí)結(jié)合起來(lái),充分利用人的認(rèn)知,這是革新性的資產(chǎn),如果只有具有邏輯性的知識(shí),我們同樣也需要這些包括知覺(jué)或者是技能知識(shí)的總結(jié),在人工智能方面,我們需要把隱性知識(shí)和顯性知識(shí)結(jié)合起來(lái),就像汽車一樣,用混合動(dòng)力的,意味著人工智能和人腦結(jié)合方面,也就是把所有的學(xué)習(xí)整合起來(lái)。最重要的一點(diǎn)我們要理解數(shù)據(jù),收集數(shù)據(jù),可以把收集的信息進(jìn)行簡(jiǎn)化。這樣的結(jié)合可能運(yùn)用到現(xiàn)在行業(yè)的各個(gè)領(lǐng)域。現(xiàn)在在醫(yī)藥領(lǐng)域,行業(yè)工業(yè)領(lǐng)域或者是汽車制藥領(lǐng)域都可以使用這樣的比如通過(guò)X光檢測(cè)產(chǎn)品的質(zhì)量,但是并沒(méi)有幫我們進(jìn)行正確的決定,所以如果做出更合理的決定,我們需要把顯性知識(shí)和隱性知識(shí)結(jié)合起來(lái),謝謝大家。
-
人工智能
+關(guān)注
關(guān)注
1806文章
48957瀏覽量
248460 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8500瀏覽量
134419 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5558瀏覽量
122696
原文標(biāo)題:演講實(shí)錄丨漢斯·烏思克爾特:結(jié)合不同類型機(jī)器學(xué)習(xí)進(jìn)行的信息和知識(shí)提取
文章出處:【微信號(hào):CAAI-1981,微信公眾號(hào):中國(guó)人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
漢思新材料|芯片級(jí)底部填充膠守護(hù)你的智能清潔機(jī)器人

漢思膠水在半導(dǎo)體封裝中的應(yīng)用概覽

簡(jiǎn)單認(rèn)識(shí)阿倫尼烏斯壽命模型

使用MATLAB進(jìn)行無(wú)監(jiān)督學(xué)習(xí)

漢思新材料取得一種封裝芯片高可靠底部填充膠及其制備方法的專利

評(píng)論