人工智能的定義
人工智能領(lǐng)域苦于存在多種概念和定義,有的太過有的則不夠。
作為該領(lǐng)域創(chuàng)始人之一的Nils Nilsson先生寫到:“人工智能缺乏通用的定義?!?/span>
隨著計算機(jī)為解決新任務(wù)挑戰(zhàn)而升級換代并推而廣之,人們對那些所謂需要依靠人類智慧才能解決的任務(wù)的定義門檻也越來越高。
所以,人工智能的定義隨著時間而演變,這一現(xiàn)象稱之為“人工智能效應(yīng)”,概括起來就是,“人工智能,就是要實(shí)現(xiàn)所有目前還無法不借助人類智慧才能實(shí)現(xiàn)的任務(wù)的集合?!?/span>
人工智能的歷史
人工智能并不是一個新名詞。
實(shí)際上,這個領(lǐng)域在20世紀(jì)50年代就已經(jīng)開始啟動,這段探索的歷史被稱為“喧囂與渴望、挫折與失望交替出現(xiàn)的時代”——最近給出的一個較為恰當(dāng)?shù)脑u價。
20世紀(jì)50年代明確了人工智能要模擬人類智慧這一大膽目標(biāo),從此研究人員開展了一系列貫穿20世紀(jì)60年代并延續(xù)到70年代的研究項(xiàng)目,這些項(xiàng)目表明,計算機(jī)能夠完成一系列所本只屬于人類能力范疇之內(nèi)的任務(wù),例如證明定理、求解微積分、通過規(guī)劃來響應(yīng)命令、履行物理動作,甚至是模擬心理學(xué)家、譜曲這樣的活動。
但是,過分簡單的算法、匱乏的難以應(yīng)對不確定環(huán)境(這種情形在生活中無處不在)的理論,以及計算能力的限制,嚴(yán)重阻礙了我們使用人工智能來解決更加困難和多樣的問題。
伴隨著對缺乏繼續(xù)努力的失望,人工智能于20世紀(jì)70年代中期逐漸淡出公眾視野。
20世紀(jì)80年代末,幾乎一半的“財富500強(qiáng)”都在開發(fā)或使用“專家系統(tǒng)”,這是一項(xiàng)通過對人類專家的問題求解能力進(jìn)行建模,來模擬人類專家解決該領(lǐng)域問題的人工智能技術(shù)。
對于專家系統(tǒng)潛力的過高希望,徹底掩蓋了它本身的局限性,包括明顯缺乏常識、難以捕捉專家的隱性知識、建造和維護(hù)大型系統(tǒng)這項(xiàng)工作的復(fù)雜性和成本,當(dāng)這一點(diǎn)被越來越多的人所認(rèn)識到時,人工智能研究再一次脫離軌道。
20世紀(jì)90年代,在人工智能領(lǐng)域的技術(shù)成果始終處于低潮,成果寥寥。反而是神經(jīng)網(wǎng)絡(luò)、遺傳算法等科技得到了新的關(guān)注,這一方面,是因?yàn)檫@些技術(shù)避免了專家系統(tǒng)的若干限制,另一方面,是因?yàn)樾滤惴ㄗ屗鼈冞\(yùn)行起來更加高效。
神經(jīng)網(wǎng)絡(luò)的設(shè)計受到了大腦結(jié)構(gòu)的啟發(fā)。遺傳算法的機(jī)制是,首先迭代生成備選解決方案,然后剔除最差方案,最后通過引入隨機(jī)變量來產(chǎn)生新的解決方案,從而“進(jìn)化”出解決問題的最佳方案。
人工智能進(jìn)步的催化劑
截止到21世紀(jì)前10年的后期,出現(xiàn)了一系列復(fù)興人工智能研究進(jìn)程的要素,尤其是一些核心技術(shù)。下面將對這些重要的因素和技術(shù)進(jìn)行詳細(xì)說明。
1)摩爾定律
在價格、體積不變的條件下,計算機(jī)的計算能力可以不斷增長。這就是被人們所熟知的摩爾定律,它以Intel共同創(chuàng)辦人Gordon Moore命名。
Gordon Moore從各種形式的計算中獲利,包括人工智能研究人員使用的計算類型。
數(shù)年以前,先進(jìn)的系統(tǒng)設(shè)計只能在理論上成立但無法實(shí)現(xiàn),因?yàn)樗枰挠嬎銠C(jī)資源過于昂貴或者計算機(jī)無法勝任。
今天,我們已經(jīng)擁有了實(shí)現(xiàn)這些設(shè)計所需要的計算資源。舉個夢幻般的例子,現(xiàn)在最新一代微處理器的性能是1971年第一代單片機(jī)的400萬倍。
2)大數(shù)據(jù)
得益于互聯(lián)網(wǎng)、社交媒體、移動設(shè)備和廉價的傳感器,這個世界產(chǎn)生的數(shù)據(jù)量急劇增加。
隨著對這些數(shù)據(jù)的價值的不斷認(rèn)識,用來管理和分析數(shù)據(jù)的新技術(shù)也得到了發(fā)展。大數(shù)據(jù)是人工智能發(fā)展的助推劑,這是因?yàn)橛行┤斯ぶ悄芗夹g(shù)使用統(tǒng)計模型來進(jìn)行數(shù)據(jù)的概率推算,比如圖像、文本或者語音,通過把這些模型暴露在數(shù)據(jù)的海洋中,使它們得到不斷優(yōu)化,或者稱之為“訓(xùn)練”——現(xiàn)在這樣的條件隨處可得。
3)互聯(lián)網(wǎng)和云計算
和大數(shù)據(jù)現(xiàn)象緊密相關(guān),互聯(lián)網(wǎng)和云計算可以被認(rèn)為是人工智能基石有兩個原因。
第一,它們可以讓所有聯(lián)網(wǎng)的計算機(jī)設(shè)備都能獲得海量數(shù)據(jù)。這些數(shù)據(jù)是人們推進(jìn)人工智能研發(fā)所需要的,因此它可以促進(jìn)人工智能的發(fā)展。
第二,它們?yōu)槿藗兲峁┝艘环N可行的合作方式——有時顯式有時隱式——來幫助人工智能系統(tǒng)進(jìn)行訓(xùn)練。
比如,有些研究人員使用類似Mechanical Turk這樣基于云計算的眾包服務(wù)來雇傭成千上萬的人來描繪數(shù)字圖像。這就使得圖像識別算法可以從這些描繪中進(jìn)行學(xué)習(xí)。谷歌翻譯通過分析用戶的反饋以及使用者的無償貢獻(xiàn)來提高它自動翻譯的質(zhì)量。
4)新算法
算法是解決一個設(shè)計程序或完成任務(wù)的路徑方法。
最近幾年,新算法的發(fā)展極大提高了機(jī)器學(xué)習(xí)的能力,這些算法本身很重要,同時也是其他技術(shù)的推動者,比如計算機(jī)視覺(這項(xiàng)科技將會在后文描述)。
機(jī)器學(xué)習(xí)算法目前被開源使用,這種情形將促成更大進(jìn)步,因?yàn)樵陂_源環(huán)境下開發(fā)人員可以補(bǔ)足和增強(qiáng)彼此的工作。
認(rèn)知技術(shù)
我們將區(qū)分人工智能領(lǐng)域和由此延伸的各項(xiàng)技術(shù)。
大眾媒體將人工智能刻畫為跟人一樣聰明的或比人更聰明的計算機(jī)的來臨。而各項(xiàng)技術(shù)則在以往只有人能做到的特定任務(wù)上面表現(xiàn)得越來越好。我們稱這些技術(shù)為認(rèn)知技術(shù),認(rèn)知技術(shù)是人工智能領(lǐng)域的產(chǎn)物,它們能完成以往只有人能夠完成的任務(wù)。
而它們正是商業(yè)和公共部門的領(lǐng)導(dǎo)者應(yīng)該關(guān)注的。
下面我們將介紹幾個最重要的認(rèn)知技術(shù)。
1)計算機(jī)視覺
是指計算機(jī)從圖像中識別出物體、場景和活動的能力。
計算機(jī)視覺技術(shù)運(yùn)用由圖像處理操作及其他技術(shù)所組成的序列來將圖像分析任務(wù)分解為便于管理的小塊任務(wù)。
比如,一些技術(shù)能夠從圖像中檢測到物體的邊緣及紋理。分類技術(shù)可被用作確定識別到的特征是否能夠代表系統(tǒng)已知的一類物體。
計算機(jī)視覺有著廣泛應(yīng)用。
其中包括,醫(yī)療成像分析被用來提高疾病的預(yù)測、診斷和治療;人臉識別被Facebook用來自動識別照片里的人物;在安防及監(jiān)控領(lǐng)域被用來指認(rèn)嫌疑人;在購物方面,消費(fèi)者現(xiàn)在可以用智能手機(jī)拍攝下產(chǎn)品以獲得更多購買選擇。
2)機(jī)器學(xué)習(xí)
指的是計算機(jī)系統(tǒng)無需遵照顯式的程序指令而只是依靠暴露在數(shù)據(jù)中來提升自身性能的能力。
其核心在于,機(jī)器學(xué)習(xí)是從數(shù)據(jù)中自動發(fā)現(xiàn)模式,模式一旦被發(fā)現(xiàn)便可用于做預(yù)測。比如,給予機(jī)器學(xué)習(xí)系統(tǒng)一個關(guān)于交易時間、商家、地點(diǎn)、價格及交易是否正當(dāng)?shù)刃庞每ń灰仔畔⒌臄?shù)據(jù)庫,系統(tǒng)就會學(xué)習(xí)到可用來預(yù)測信用卡欺詐的模式。處理的交易數(shù)據(jù)越多,預(yù)測就會越好。
機(jī)器學(xué)習(xí)的應(yīng)用范圍非常廣泛,針對那些產(chǎn)生龐大數(shù)據(jù)的活動,它幾乎擁有改進(jìn)一切性能的潛力。除了欺詐甄別之外,這些活動還包括銷售預(yù)測、庫存管理、石油和天然氣勘探、以及公共衛(wèi)生。
機(jī)器學(xué)習(xí)技術(shù)在其他的認(rèn)知技術(shù)領(lǐng)域也扮演著重要角色,比如計算機(jī)視覺,它能在海量圖像中通過不斷訓(xùn)練和改進(jìn)視覺模型來提高其識別對象的能力。
3)自然語言處理
是指計算機(jī)擁有的人類般文本處理的能力。
比如,從文本中提取意義,甚至從那些可讀的、風(fēng)格自然、語法正確的文本中自主解讀出含義。
一個自然語言處理系統(tǒng)并不了解人類處理文本的方式,但是它卻可以用非常復(fù)雜與成熟的手段巧妙處理文本,例如自動識別一份文檔中所有被提及的人與地點(diǎn);識別文檔的核心議題;或者在一堆僅人類可讀的合同中,將各種條款與條件提取出來并制作成表。
以上這些任務(wù)通過傳統(tǒng)的文本處理軟件根本不可能完成,后者僅能針對簡單的文本匹配與模式進(jìn)行操作。
請思考一個老生常談的例子,它可以體現(xiàn)自然語言處理面臨的一個挑戰(zhàn)。
在句子“光陰似箭(Time flies like an arrow)”中每一個單詞的意義看起來都很清晰,直到系統(tǒng)遇到這樣的句子“果蠅喜歡香蕉(Fruit flies like a banana)”,用“水果(fruit)”替代了“時間(time)”,并用“香蕉(banana)”替代“箭(arrow)”,就改變了“飛逝/飛著的(like)”與“像/喜歡(like)”這兩個單詞的意思。
自然語言處理,像計算機(jī)視覺技術(shù)一樣,將各種有助于實(shí)現(xiàn)目標(biāo)的多種技術(shù)進(jìn)行了融合。
建立語言模型來預(yù)測語言表達(dá)的概率分布,舉例來說,就是某一串給定字符或單詞表達(dá)某一特定語義的最大可能性。選定的特征可以和文中的某些元素結(jié)合來識別一段文字,通過識別這些元素可以把某類文字同其他文字區(qū)別開來,比如垃圾郵件同正常郵件。
4)機(jī)器人技術(shù)
將機(jī)器視覺、自動規(guī)劃等認(rèn)知技術(shù)整合至極小卻高性能的傳感器、致動器、以及設(shè)計巧妙的硬件中,這就催生了新一代的機(jī)器人,它有能力與人類一起工作,能在各種未知環(huán)境中靈活處理不同的任務(wù)。
例如無人機(jī),還有可以在車間為人類分擔(dān)工作的“cobots”,還包括那些從玩具到家務(wù)助手的消費(fèi)類產(chǎn)品。
5)語音識別技術(shù)
主要是關(guān)注自動且準(zhǔn)確的轉(zhuǎn)錄人類的語音。
該技術(shù)必須面對一些與自然語言處理類似的問題,在不同口音的處理、背景噪音、區(qū)分同音異形異義詞(“buy”和“by”聽起來是一樣的)方面存在一些困難,同時還需要具有跟上正常語速的工作速度。
語音識別系統(tǒng)使用一些與自然語言處理系統(tǒng)相同的技術(shù),再輔以其他技術(shù),比如描述聲音和其出現(xiàn)在特定序列和語言中概率的聲學(xué)模型等。
語音識別的主要應(yīng)用包括醫(yī)療聽寫、語音書寫、電腦系統(tǒng)聲控、電話客服等。比如Domino’s Pizza最近推出了一個允許用戶通過語音下單的移動APP。
還沒有評論,來說兩句吧...