人工智能的知識點科普

2025China.cn 2020年12月23日

　　早在上世紀50年代，人工智能行業(yè)先驅Minsky和McCarthy將人工智能描述為由機器執(zhí)行的任何任務，這些任務在以往需要人類智能才能完成。

　　這顯然是一個相當寬泛的定義，這就是有時人們針對某種技術是否真是人工智能進行爭論的原因。

　　如今對“智能”的定義更為具體。谷歌公司人工智能研究人員、機器學習軟件庫Keras的創(chuàng)建者FrancoisChollet曾表示，智能與系統(tǒng)在新環(huán)境中適應和即興發(fā)揮的能力有關，能夠概括其知識并將其應用于不熟悉的場景。

　　他說：“智能是指在以前沒有準備好的任務方面獲得新技能的效率。智能本身并不是技能，不是能做什么，而是學習新事物的能力和效率。”

　　這是人工智能的一個定義。在這個定義中，現(xiàn)代人工智能驅動的系統(tǒng)(例如虛擬助手)將被描述為具有“狹義人工智能”的特征。在執(zhí)行有限的一組任務(如語音識別或計算機視覺)時，概括其訓練的能力。

　　通常情況下，人工智能系統(tǒng)至少會表現(xiàn)出與人類智能相關的以下某些行為：計劃、學習、推理、問題解決、知識表示、感知、運動和操縱，在某些程度上還包括社會智能和創(chuàng)造力。

人工智能的用途是什么?

　　如今，人工智能幾乎無處不在，例如推薦人們應該在網(wǎng)上購買的物品，了解對虛擬助手(例如亞馬遜的Alexa和蘋果的Siri)所說的內容，識別照片中的人物和內容，識別垃圾郵件，或者檢測信用卡欺詐。

人工智能有哪些不同類型?

　　人工智能可以分為兩大類：狹義人工智能和通用人工智能。

　　如上所述，狹義的人工智能是人們目前在計算機中看到的一切：已經(jīng)被訓練或學會如何執(zhí)行特定任務的智能系統(tǒng)。

　　這種機器智能在蘋果iPhone上的Siri虛擬助手的語音和語言識別、自動駕駛汽車的視覺識別系統(tǒng)、或根據(jù)人們過去購買的商品推薦可能喜歡的產(chǎn)品的推薦引擎中都可以明顯地看出。與人類不同的是，這些系統(tǒng)只能學習或被教授如何完成定義的任務，這就是它們被稱為狹義人工智能的原因。

狹義人工智能能做什么?

　　狹義人工智能有大量應用程序：無人機的視頻饋送、對基礎設施(如輸油管道)進行視覺檢查、組織個人和企業(yè)日歷、響應簡單的客戶服務查詢、與其他智能系統(tǒng)協(xié)調執(zhí)行這些任務包括在合適的時間和地點預定酒店、幫助放射線醫(yī)師發(fā)現(xiàn)X光片中的潛在腫瘤、在線標記不當內容、從物聯(lián)網(wǎng)設備收集的數(shù)據(jù)中檢測電梯的磨損，以及通過衛(wèi)星生成世界3D模型圖像等。

　　這些學習系統(tǒng)的新應用一直在涌現(xiàn)。顯卡設計廠商Nvidia公司最近推出了一種基于人工智能的Maxine系統(tǒng)，它可以讓人們進行高質量的視頻通話，并且不用考慮其互聯(lián)網(wǎng)連接速度。該系統(tǒng)通過不通過互聯(lián)網(wǎng)傳輸完整的視頻流，而是以實時再現(xiàn)通話者的面部表情和動作并且與視頻不可區(qū)分的方式，將通話所需的帶寬減少了10倍。

　　但是，盡管這些系統(tǒng)具有尚未開發(fā)的潛力，但有時對該技術的期望卻超過了現(xiàn)實。自動駕駛汽車就是一個很好的例子，自動駕駛汽車本身就得到了人工智能驅動的系統(tǒng)(例如計算機視覺)的支持。電動汽車生產(chǎn)商特斯拉公司首席執(zhí)行官埃隆·馬斯克(ElonMusk)最初提出的汽車自動駕駛系統(tǒng)將從有限的輔助駕駛能力升級為“全自動駕駛”的時間表如今有些落后，作為其測試計劃的一部分，全自動駕駛選項最近才推出專業(yè)駕駛程序。

通用人工智能可以做什么?

　　通用人工智能截然不同，它是一種在人類身上發(fā)現(xiàn)的適應性智能，是一種靈活的智能形式，能夠學習如何執(zhí)行完全不同的任務，從理發(fā)到構建電子表格，或者基于積累的經(jīng)驗對各種各樣的主題進行推理。這種人工智能在電影中更為常見，例如電影《終結者》中的Skynet，但現(xiàn)在已經(jīng)不存在了——人工智能專家們對它在什么時候能成為現(xiàn)實存在嚴重的分歧。

　　人工智能研究人員VincentCMüller和哲學家NickBostrom在2012年對四組專家進行的一項調查顯示，到2040年至2050年，通用人工智能(AGI)的開發(fā)機會將達到50%，到2075年將上升到90%。該小組甚至進一步預測，所謂的“超級智能”在通用人工智能(AGI)實現(xiàn)約30年后就可以出現(xiàn)。

　　然而，人工智能專家最近的評估更為謹慎?，F(xiàn)代人工智能研究領域的先驅者，如GeoffreyHinton、DemisHassabis和YannLeCun表示，鑒于對現(xiàn)代人工智能領域的領導者持懷疑態(tài)度，以及現(xiàn)代狹義人工智能系統(tǒng)與通用人工智能(AGI)的本質迥然不同，因此幾乎沒有理由擔心通用人工智在不久的將來能為社會帶來影響。

　　也就是說，一些人工智能專家認為，鑒于人們對人腦的了解有限，這樣的預測是非常樂觀的，并且相信通用人工智能(AGI)的出現(xiàn)還需要數(shù)百年的時間。

人工智能發(fā)展的最新里程碑是什么?

　　雖然現(xiàn)代狹義人工智能可能僅限于執(zhí)行特定任務，但在它們的專業(yè)領域內，這些系統(tǒng)有時能夠表現(xiàn)出超人的表現(xiàn)，而這種特質通常是人類固有的。

　　雖然沒有太多的技術突破，但也有一些亮點：谷歌公司在2009年表示，豐田普銳斯汽車采用其開發(fā)的自動駕駛技術有可能完成10次以上每次100公里路程的測試，讓無人駕駛汽車技術向前邁進。

　　2011年，IBMWatson在美國智力競賽節(jié)目《危險邊緣》中獲勝，擊敗了該節(jié)目有史以來最好的兩位人類選手，成為全球頭條新聞。為了獲勝，Watson采用自然語言處理和分析技術對海量數(shù)據(jù)進行處理，以回答人類提出的問題，通常其處理的速度不到1秒鐘。

　　2012年，另一項突破性進展預示著人工智能有能力處理許多以前認為對任何機器來說過于復雜的新任務。那一年，AlexNet系統(tǒng)在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽中取得了決定性的勝利。在圖像識別比賽中，與競爭對手相比，AlexNet的錯誤率降低了一半。

　　AlexNet的表現(xiàn)證明了基于神經(jīng)網(wǎng)絡的學習系統(tǒng)的力量，這種機器學習模型已經(jīng)存在了幾十年，但由于對體系結構的改進和摩爾定律使并行處理能力的飛躍，最終實現(xiàn)了它的潛力。機器學習系統(tǒng)在執(zhí)行計算機視覺方面的能力也成為當年的頭條新聞，谷歌訓練了一個可以識別貓的圖片的機器學習系統(tǒng)。

　　另一個引起人們關注的機器學習系統(tǒng)的應用案例是2016年GoogleDeepMind公司的AlphaGo戰(zhàn)勝了一位圍棋冠軍。圍棋是一款古老的中國棋類游戲，其復雜性讓計算機系統(tǒng)困擾了幾十年。這是因為圍棋每回合大約有200步，而國際象棋只有20步左右。在圍棋比賽的過程中，其每一步動作有太多可能性，因此從計算的角度來看，預先搜索每一個動作以確定最佳步驟的成本太高。取而代之的是，AlphaGo通過在3000萬個圍棋游戲案例中模仿人類專家的動作，并將其輸入深度學習神經(jīng)網(wǎng)絡來訓練如何玩這個游戲。

　　訓練這些深度學習網(wǎng)絡可能會花費很長時間，隨著系統(tǒng)逐漸完善其模型以取得最佳結果，需要攝取和迭代大量數(shù)據(jù)。

　　然而，最近谷歌公司使用AlphaGoZero(一種“完全隨機”游戲的系統(tǒng))改進了訓練過程，然后從結果中學習。GoogleDeepMind公司首席執(zhí)行官DemisHassabis表示，還將推出新版本的AlphaGoZero，該版本已經(jīng)掌握如何下國際象棋的游戲。

　　人工智能技術不斷實現(xiàn)新的里程碑：OpenAI訓練的人工智能系統(tǒng)在在線多人游戲Dota2的一對一比賽中擊敗了世界頂級玩家。

　　2020年，人工智能系統(tǒng)似乎獲得了像人類一樣寫作和交談的能力，其中包括人們可以想到的任何話題。

　　這個系統(tǒng)名為GeneraTIvePre-trainingTransformer3，簡稱GPT-3，是一個神經(jīng)網(wǎng)絡，它使用開放式網(wǎng)絡上數(shù)十億篇英語文章進行訓練。

　　在OpenAI對其進行測試后不久，人們就開始對GPT-3的能力產(chǎn)生興趣，其能力幾乎可以生成涉及該主題的任何文章，這些文章乍一看往往很難與人類撰寫的文章區(qū)分開來。類似的結果也出現(xiàn)在其他領域，它能夠令人信服地回答廣泛主題的問題。

　　但是，盡管許多GPT-3生成的文章具有真實感，但進一步的測試發(fā)現(xiàn)，其生成的句子并不符合要求，提供表面上看似合理但混亂的陳述，有時甚至是胡言亂語。

　　人們對使用模型的自然語言理解作為未來服務的基礎仍有相當大的興趣，并且可以選擇開發(fā)人員通過OpenAI的betaAPI來構建軟件。它還將被納入未來通過微軟的Azure云平臺提供的服務中。

　　人工智能潛力最顯著的例子可能是在2020年末，基于Google關注的神經(jīng)網(wǎng)絡AlphaFold2證明了這一結果。

　　該系統(tǒng)可以查看蛋白質組成部分(氨基酸)的能力，并得出了蛋白質的3D結構可能對疾病的理解和藥物開發(fā)的速度產(chǎn)生深遠影響的結論。在蛋白質結構預測的關鍵評估競賽中，AlphaFold2能夠以與晶體學相媲美的準確性確定蛋白質的3D結構，而晶體學是令人信服地對蛋白質建模的黃金標準。

　　與需要數(shù)月才能獲得結果的晶體學不同，AlphaFold2可以在數(shù)小時內對蛋白質進行建模。蛋白質的3D結構在人類生物學和疾病中起著如此重要的作用，這種加速已被預示為醫(yī)學界的里程碑式突破，更不用說在生物技術中使用酶的其他領域中的潛在應用。

什么是機器學習?

　　事實上，到目前為止提到的所有成就都來自機器學習，機器學習是人工智能的一個子集，近年來在該領域取得的成就占了絕大多數(shù)。如今人們談論人工智能時，通常都是在談論機器學習。

　　簡而言之，當前的機器學習技術正在實現(xiàn)某種復興，簡單來說，機器學習是計算機系統(tǒng)學習如何執(zhí)行任務的方法，而不是通過編程來了解如何執(zhí)行任務的方法。對機器學習的描述可以追溯到1959年，當時它是該領域的先驅ArthurSamuel發(fā)明的，他開發(fā)了世界上第一個自學習系統(tǒng)之一，即Samuel跳棋程序。

　　為了自學習，這些系統(tǒng)被輸入大量的數(shù)據(jù)，然后用這些數(shù)據(jù)來學習如何執(zhí)行特定的任務，例如理解語音或為照片添加說明。這個數(shù)據(jù)集的質量和大小對于建立一個能夠準確執(zhí)行其指定任務的系統(tǒng)非常重要。例如，如果正在構建一個機器學習系統(tǒng)來預測房價，那么培訓數(shù)據(jù)應不僅僅包括房地產(chǎn)面積，還應包括其他顯著因素，如臥室數(shù)量或花園面積。

什么是神經(jīng)網(wǎng)絡?

　　機器學習成功的關鍵是神經(jīng)網(wǎng)絡。這些數(shù)學模型能夠調整內部參數(shù)以更改其輸出。在訓練期間，向神經(jīng)網(wǎng)絡饋送數(shù)據(jù)集，該數(shù)據(jù)集教給它一些特定數(shù)據(jù)時應該輸出的內容。具體來說，可能會向網(wǎng)絡饋送介于0到9之間的數(shù)字的灰度圖像以及一串二進制數(shù)字(0和1)，這些二進制數(shù)字指示每個灰度圖像中顯示了哪個數(shù)字。然后將對網(wǎng)絡進行訓練，調整其內部參數(shù)，直到以高準確度對每個圖像中顯示的數(shù)字進行分類。然后，可以使用這個經(jīng)過訓練的神經(jīng)網(wǎng)絡對0到9之間數(shù)字的其他灰度圖像進行分類。1989年，YannLeCun發(fā)表了一篇論文展示了神經(jīng)網(wǎng)絡的應用，美國郵政局已經(jīng)采用神經(jīng)網(wǎng)絡技術識別手寫的郵政編碼。

　　神經(jīng)網(wǎng)絡的結構和功能基于大腦中神經(jīng)元之間非常松散的聯(lián)系。神經(jīng)網(wǎng)絡由互連的算法層組成，這些算法層將數(shù)據(jù)相互饋送，并且可以通過修改數(shù)據(jù)在這些層之間傳遞時的重要性來進行訓練，以執(zhí)行特定任務。在訓練這些神經(jīng)網(wǎng)絡的過程中，當數(shù)據(jù)在各層之間傳遞時，附加在數(shù)據(jù)上的權重將會不斷變化，直到神經(jīng)網(wǎng)絡的輸出非常接近期望值，此時神經(jīng)網(wǎng)絡將“學習”如何執(zhí)行特定任務。期望的輸出可以是從正確地標記圖像中的水果到根據(jù)其傳感器數(shù)據(jù)預測電梯何時可能發(fā)生故障的任何事情。

　　機器學習的一個子集是深度學習，在深度學習中，神經(jīng)網(wǎng)絡被擴展成具有大量多層網(wǎng)絡，這些網(wǎng)絡使用大量的數(shù)據(jù)進行訓練。正是這些深度神經(jīng)網(wǎng)絡推動了計算機執(zhí)行語音識別和計算機視覺等任務的能力的當前飛躍。

　　神經(jīng)網(wǎng)絡有多種類型，各有優(yōu)缺點。遞歸神經(jīng)網(wǎng)絡(RNN)是一種特別適合于自然語言處理(NLP)的神經(jīng)網(wǎng)絡，它可以理解文本和語音識別的含義，而卷積神經(jīng)網(wǎng)絡則植根于圖像識別，其用途與推薦系統(tǒng)和自然語言處理(NLP)一樣多樣。神經(jīng)網(wǎng)絡的設計也在不斷發(fā)展，研究人員改進了一種更有效的深度神經(jīng)網(wǎng)絡形式，稱為長短期記憶(簡稱LSTM)，這是一種用于自然語言處理(NLP)等任務和預測股市的遞歸神經(jīng)網(wǎng)絡(RNN)構，使其運行速度足夠快，可以在谷歌翻譯等按需系統(tǒng)中使用。

其他類型的人工智能有哪些?

　　人工智能研究的另一個領域是進化計算，它借鑒了達爾文的自然選擇理論，并發(fā)現(xiàn)遺傳算法經(jīng)歷了幾代人之間的隨機變異和組合，從而試圖發(fā)展出針對給定問題的最佳解決方案。

　　這種方法甚至被用來幫助設計人工智能模型，有效地利用人工智能來幫助構建人工智能。這種使用進化算法來優(yōu)化神經(jīng)網(wǎng)絡的方法被稱為神經(jīng)進化，隨著智能系統(tǒng)的使用越來越普遍，特別是對數(shù)據(jù)科學家的需求往往供不應求的情況下，在幫助設計高效的人工智能方面可以發(fā)揮重要作用。Uber公司的人工智能實驗室展示了這項技術，該實驗室發(fā)表了關于使用遺傳算法訓練深層神經(jīng)網(wǎng)絡以解決強化學習問題的論文。

　　此外還有專家系統(tǒng)，在這種系統(tǒng)中，計算機被編入規(guī)則，允許它們根據(jù)大量輸入做出一系列決定，使計算機能夠模仿人類專家在特定領域的行為。駕駛飛機的自動駕駛系統(tǒng)就是這些基于專家系統(tǒng)的一個例子。

是什么推動了人工智能的復興?

　　如上所述，近年來，人工智能研究的最大突破是機器學習領域，尤其是在深度學習領域。

　　這在某種程度上是由于數(shù)據(jù)的易用性驅動的，而更重要的是，并行計算能力的爆炸式增長，在此期間，越來越多的圖形處理單元(GPU)集群用于訓練機器學習系統(tǒng)。

　　這些集群不僅為訓練機器學習模型提供了功能強大得多的系統(tǒng)，而且它們現(xiàn)在作為云服務在互聯(lián)網(wǎng)上廣泛使用。隨著時間的推移，全球主要的科技公司(如谷歌、微軟和特斯拉)已經(jīng)開始使用專門為運行和培訓的機器學習模式量身定做的芯片。

　　谷歌公司的TensorProcessingUnit(TPU)就是這些定制芯片的一個例子，它的最新版本加快了使用谷歌TensorFlow軟件庫構建的有用機器學習模型從數(shù)據(jù)中推斷信息的速度，以及它們接受訓練的速度。

機器學習的要素是什么?

　　如上所述，機器學習是人工智能的一個子集，通常分為兩大類：有監(jiān)督學習和無監(jiān)督學習。

　　(1)監(jiān)督學習

　　訓練人工智能系統(tǒng)的一種常見技術是通過使用大量帶標簽的例子來訓練它們。這些機器學習系統(tǒng)被輸入大量的數(shù)據(jù)，這些數(shù)據(jù)經(jīng)過注釋以突出感興趣的特征。這些可能是照片，以表明它們是否包含書面句子或腳注，以表明“低音”一詞是與音樂或魚類有關。一旦經(jīng)過訓練，系統(tǒng)就可以將這些標簽應用到新數(shù)據(jù)上，例如剛剛上傳的照片中的一只狗。

　　通過示例進行機器教學的過程稱為監(jiān)督學習，標記這些示例的角色通常是通過AmazonMechanicalTurk等平臺進行雇用在線工作人員執(zhí)行的。

　　訓練這些系統(tǒng)通常需要大量的數(shù)據(jù)，有些系統(tǒng)需要搜索數(shù)百萬個例子來學習如何有效地執(zhí)行任務，在大數(shù)據(jù)和廣泛數(shù)據(jù)挖掘的時代，這一點越來越可能。培訓數(shù)據(jù)集龐大且規(guī)模不斷擴大——谷歌公司的開放式圖像數(shù)據(jù)集約有900萬張圖片，而其標簽視頻存儲庫YouTube-8M鏈接了700萬個標簽視頻。ImageNet是早期的此類數(shù)據(jù)庫之一，擁有超過1400萬張分類圖像。經(jīng)過近5萬人耗費兩年時間的編纂，將其匯集在一起，其中大多數(shù)人是通過亞馬遜AmazonMechanicalTurk招募的，他們檢查、分類并標記了近10億張候選圖片。

　　近年來，生成性對抗網(wǎng)絡(GAN)已被應用于機器學習系統(tǒng)中，這些系統(tǒng)只需要少量的標記數(shù)據(jù)和大量未標記的數(shù)據(jù)。

　　這種方法可以增加半監(jiān)督學習的使用，在這種情況下，系統(tǒng)可以學習如何使用比當今使用監(jiān)督學習的訓練系統(tǒng)所需要的少得多的標記數(shù)據(jù)來執(zhí)行任務。

　　(2)無監(jiān)督學習

　　相比之下，無監(jiān)督學習使用不同的方法，即算法嘗試識別數(shù)據(jù)中的模式，尋找可用于對數(shù)據(jù)進行分類的相似性。例如，將重量相似的水果或發(fā)動機尺寸相似的汽車聚集在一起。

　　該算法并不是預先設置好挑選特定類型的數(shù)據(jù)，而是簡單地尋找可以根據(jù)相似性進行分組的數(shù)據(jù)，例如谷歌新聞每天都會將類似主題的報道分組在一起。

　　(3)強化學習

　　強化學習的一個粗略的類比是，當寵物表演一個節(jié)目時，會給它一個獎勵。在強化學習中，系統(tǒng)試圖根據(jù)輸入數(shù)據(jù)最大化獎勵，基本上要經(jīng)歷反復試驗的過程，直到達到可能的最佳結果。

　　強化學習的一個例子是GoogleDeepMind的DeepQ網(wǎng)絡，該網(wǎng)絡已被用于在各種經(jīng)典視頻游戲中實現(xiàn)最佳人類表現(xiàn)。系統(tǒng)從每個游戲中獲取像素，并確定各種信息，例如屏幕上物體之間的距離。

　　通過查看每個游戲中獲得的分數(shù)，系統(tǒng)會建立一個模型，該模型的動作將在不同情況下使分數(shù)最大化，例如，在視頻游戲Breakout的情況下，應將球拍移至其中以攔截球。

　　該方法還用于機器人技術研究，其中強化學習可以幫助教會自主機器人在現(xiàn)實環(huán)境中表現(xiàn)的最佳方式。

哪些公司在人工智能領域處于領先地位?

　　隨著人工智能在現(xiàn)代軟件和服務中扮演越來越重要的角色，全球主要的科技公司都在努力開發(fā)強大的機器學習技術，以供內部使用并通過云服務向公眾出售。

　　盡管可能是谷歌及其DeepMindAIAlphaFold和AlphaGo系統(tǒng)對公眾的人工智能意識產(chǎn)生了很大的影響，但每個開創(chuàng)人工智能研究新局面的公司都有可能成為頭條新聞中的主角。

哪些人工智能服務可用?

　　全球主要的云計算提供商——AWS、微軟Azure和谷歌云平臺都提供了對GPU陣列的訪問，用于培訓和運行機器學習模型。而谷歌公司還準備讓用戶使用其Tensor處理單元(其定制設計的定制芯片)針對訓練和運行機器學習模型進行優(yōu)化。

　　這三家云計算提供商(基于云計算的數(shù)據(jù)存儲)均提供了所有必需的相關基礎設施和服務，能夠存儲訓練機器學習模型所需的大量數(shù)據(jù)，轉換數(shù)據(jù)以準備進行分析的服務，可以清晰顯示結果的可視化工具，以及簡化模型構建的軟件。

　　這些云平臺甚至還簡化了自定義機器學習模型的創(chuàng)建，谷歌公司提供了一種自動創(chuàng)建人工智能模型的服務，其名稱為CloudAutoML。這項拖放服務可建立自定義的圖像識別模型，并且用戶不必具備機器學習方面的專業(yè)知識。

　　基于云計算的機器學習服務正在不斷發(fā)展。亞馬遜公司現(xiàn)在提供了許多產(chǎn)品，旨在簡化機器學習模型的培訓過程，并且最近推出了AmazonSageMakerClarify，該工具可幫助組織消除培訓數(shù)據(jù)中的偏見和不平衡，這些偏見和不平衡可能導致受過訓練的模型進行錯誤的預測。

　　對于那些不想建立自己的機器學習模式，而是想消費人工智能驅動的按需服務(如語音、視覺和語言識別)的公司來說，微軟Azure在提供的服務范圍方面表現(xiàn)突出，緊隨其后的是谷歌云平臺，然后是AWS。與此同時，除了提供一般的按需服務外，IBM公司還試圖銷售面向從醫(yī)療保健到零售等各個領域的特定行業(yè)人工智能服務，將這些服務組合在IBMWatson旗下，并投資20億美元購買了WeatherChannel，以釋放大量數(shù)據(jù)，以增強其人工智能服務。

哪家主要的科技公司在人工智能競賽中獲勝?

　　每家科技巨頭以及Facebook等其他公司都使用人工智能來幫助推動各種公共服務：提供搜索結果、提供推薦、識別照片中的人物和事物、按需翻譯、發(fā)現(xiàn)垃圾郵件，這些服務清單非常廣泛。

　　但這場人工智能戰(zhàn)爭最明顯的表現(xiàn)之一是虛擬助理的興起，比如蘋果的Siri、亞馬遜的Alexa、谷歌的助手和微軟的Cortana。

　　語音識別和自然語言處理依賴人工智能，并且需要龐大的語料庫來回答查詢，因此開發(fā)這些助手需要大量技術。

　　不過，雖然蘋果的Siri可能首先嶄露頭角，但谷歌和亞馬遜的助手們后來在人工智能領域超越了蘋果公司——GoogleAssistant具有回答各種查詢的能力，而亞馬遜的Alexa具有大量的“技能”由第三方開發(fā)人員創(chuàng)建以增加其功能。

　　隨著時間的推移，這些人工智能助理的能力在不斷提高，使它們能夠更迅速地回應人們在日常談話中提出的問題。例如，GoogleAssistant現(xiàn)在提供了一個名為“繼續(xù)對話”的功能，用戶可以在最初的查詢中提出后續(xù)問題，例如“今天天氣怎么樣?”，然后是“明天的天氣怎么樣?”，并且系統(tǒng)了解到后續(xù)問題也與天氣有關。

　　這些虛擬助手和相關服務不僅可以處理語音，還可以使用GoogleLens的最新版本來翻譯圖像中的文本，并允許用戶使用照片搜索衣服或家具等商品。

　　盡管Cortana已經(jīng)內置在Windows10中，但最近面臨困境。亞馬遜的Alexa現(xiàn)在可以在Windows10個人電腦上免費使用，而微軟公司則對Cortana在操作系統(tǒng)中的角色進行了改造，將更多精力放在生產(chǎn)任務上，例如管理用戶的日程安排。而不是在其他助手中找到更多以消費者為中心的功能，例如播放音樂。

　　● 實現(xiàn)目標：結構化數(shù)據(jù)、語義、機器人技術和人工智能的未來。

　　● Adobe推出人工智能工具來跟蹤全渠道、更快地發(fā)現(xiàn)異常。

　　● IBM公司增加了用于閱讀理解、FAQ提取的Watson工具。

哪些國家在人工智能領域處于領先地位?

　　如果有人認為美國科技巨頭在人工智能領域占主導地位，那么這種想法是錯誤的。中國科技廠商阿里巴巴、百度、聯(lián)想正在電子商務和自主駕駛等領域大力投資人工智能。中國正在遵循三步走的計劃，將人工智能變成該國的核心產(chǎn)業(yè)。到2020年底，該產(chǎn)業(yè)的價值將達到1500億元人民幣(合220億美元)，目標是到2030年成為世界領先的人工智能大國。

　　百度公司已投資開發(fā)無人駕駛汽車，該技術由其深度學習算法百度AutoBrain提供支持，經(jīng)過數(shù)年的測試，其阿波羅自動駕駛汽車在測試中行駛了300多萬英里，在全球27個城市載客超過10萬人。百度公司的創(chuàng)始人預測自動駕駛汽車將在五年內在中國城市中普及。

　　一些分析師認為，在未來的人工智能研究方面，中國將比美國更具優(yōu)勢。

如何開始使用人工智能?

　　雖然人們可以為其電腦購買一個中等功能的NvidiaGPU(大約在NvidiaGeForceRTX2060或更快的地方)，并開始訓練機器學習模型，但嘗試人工智能相關服務的最簡單方法可能是采用云服務。

　　全球主要的科技公司通常提供各種各樣的人工智能服務，從構建和訓練自己的機器學習模型的基礎設施到允許按需訪問的人工智能工具(如語音、語言、視覺和情感識別)的網(wǎng)絡服務。

人工智能將如何改變世界?

　　(1)機器人和無人駕駛汽車

　　希望機器人能夠自主行動、理解和導航周圍的世界，這意味著機器人學和人工智能之間有著天然的重疊。雖然人工智能只是機器人技術之一，但人工智能的使用正在幫助機器人進入新的領域，如自動駕駛汽車、送貨機器人，以及幫助機器人學習新技能。在2020年初，通用汽車和本田推出一款電動無人駕駛汽車CruiseOrigin，谷歌母公司Alphabet公司的自動駕駛業(yè)務部門Waymo最近在亞利桑那州鳳凰城向普通公眾開放了robotaxi服務，其提供的服務覆蓋城市50平方英里的區(qū)域。

　　(2)虛假新聞

　　人們正處于擁有可以創(chuàng)建逼真的圖像或以完美音調方式復制某人聲音的神經(jīng)網(wǎng)絡的邊緣。隨之而來的是巨大的顛覆性社會變革的潛力，例如不再能夠將視頻或音頻素材視為真正的視頻。人們還開始擔憂可能會使用這種技術來盜用人們的圖象。

　　(3)語音和語言識別

　　機器學習系統(tǒng)幫助計算機以幾乎95%的準確率識別人們所說的內容。根據(jù)微軟公司人工智能和研究小組發(fā)布的報告，他們已經(jīng)開發(fā)出一種系統(tǒng)，能夠像翻譯人員一樣準確地翻譯口語。

　　隨著研究人員追求99%準確性的目標，人們期望與計算機對話以及更傳統(tǒng)的人機交互形式變得越來越普遍。

　　與此同時，OpenAI的語言預測模型GPT-3最近引起了業(yè)界關注，因為它能夠創(chuàng)建可以被認為是人類所寫的文章。

　　(4)面部識別和監(jiān)視

　　近年來，人臉識別系統(tǒng)的準確性有了突飛猛進的發(fā)展，百度公司表示，只要視頻中的人臉足夠清晰，它就可以以99%的準確性匹配人臉。

　　盡管世界各地的隱私法規(guī)各不相同，但這種更具侵入性的人工智能技術(包括能夠識別情緒的人工智能)很可能會逐漸變得更為廣泛。

　　(5)醫(yī)療保健

　　人工智能最終會對醫(yī)療保健產(chǎn)生巨大的影響，幫助放射科醫(yī)生在X光片中發(fā)現(xiàn)腫瘤，幫助研究人員發(fā)現(xiàn)與疾病相關的基因序列，并識別出可能導致更有效藥物的分子。谷歌公司的AlphaFold2機器學習系統(tǒng)最近的突破有望將開發(fā)新藥的關鍵步驟所花費的時間從數(shù)月縮短至數(shù)小時。

　　在世界各地的醫(yī)院都有人工智能相關技術的試驗。其中包括IBM的Watson臨床決策支持工具，該工具由MemorialSloanKettering癌癥中心的腫瘤學家進行了培訓，以及英國國家衛(wèi)生服務局對GoogleDeepMind系統(tǒng)的使用，它將幫助發(fā)現(xiàn)眼睛異常并簡化篩查患者頭頸部癌癥的過程。

　　(6)強化歧視和偏見

　　機器學習系統(tǒng)如何整理其訓練數(shù)據(jù)中反映的人為偏見和社會不平等現(xiàn)象的方式日益引起人們的關注。這些擔憂已通過多個示例證明，即用于訓練此類系統(tǒng)的數(shù)據(jù)缺乏多樣性會對現(xiàn)實世界產(chǎn)生負面影響。

　　2018年，麻省理工學院和微軟公司共同發(fā)布的一項研究論文發(fā)現(xiàn)，大型科技公司出售的面部識別系統(tǒng)在識別膚色較深的人時遭受的錯誤率明顯更高，這一問題歸因于訓練數(shù)據(jù)集主要由白人組成。

　　一年后的另一項研究強調，亞馬遜的RekogniTIon面部識別系統(tǒng)在識別膚色較深的人的性別方面存在問題。

　　自從這項研究報告發(fā)布以來，許多大型科技公司暫時停止了向警察部門提供面部識別系統(tǒng)。

　　2018年，亞馬遜公司廢棄了一款機器學習招聘工具，該工具將男性求職者視為首選，這是培訓數(shù)據(jù)差異化導致結果扭曲的另一個例子。如今，正在進行研究以抵消自學系統(tǒng)中的偏見。

　　(7)人工智能與全球變暖

　　隨著機器學習模型和用于訓練它們的數(shù)據(jù)集的規(guī)模不斷擴大，塑造和運行這些模型的龐大計算集群的碳足跡也在增長。世界經(jīng)濟論壇在2018年發(fā)表了一篇論文，主題是數(shù)據(jù)中心供電和制冷設備對環(huán)境的影響。2019年的一項估計是，機器學習系統(tǒng)所需的電力每3.4個月翻一番。

　　最近，通過發(fā)布語言預測模型GPT-3(一個擁有約1，750億個參數(shù)的龐大的神經(jīng)網(wǎng)絡)，人們開始關注訓練強大的機器學習模型所需的大量能源問題。

　　雖然訓練這些模型所需的資源可能是大量的，而且基本上只有大公司才能具有，但一旦進行良好的訓練，運行這些模型所需的能量就大大減少了。然而，隨著對基于這些模型的服務需求的增長，電力消耗和由此產(chǎn)生的環(huán)境影響再次成為一個問題。

　　一種觀點認為，培訓和運行更大模型對環(huán)境的影響需要與潛在的機器學習進行權衡，必須具有顯著的積極影響，例如，在谷歌DeepMind的alphafold2取得突破之后，醫(yī)療保健領域可能出現(xiàn)更迅速的進步。

人工智能會危害人類嗎?

　　同樣，獲得這個問題的答案取決于你問誰。隨著以人工智能為動力的系統(tǒng)變得越來越強大，對不利因素的警告也越來越嚴峻。

　　特斯拉公司首席執(zhí)行官埃隆·馬斯克宣稱，“人工智能是人類文明生存的根本風險”。為了推動更強大的監(jiān)管監(jiān)督和開展更多負責任的研究以減輕人工智能的負面影響，他成立了OpenAI，這是一家非盈利性人工智能研究公司，旨在促進和發(fā)展有利于整個社會的友好人工智能。著名物理學家斯蒂芬·霍金曾警告說，一旦創(chuàng)建了足夠先進的人工智能，它將迅速發(fā)展到遠遠超過人類能力的地步，這一現(xiàn)象被稱為奇點，并可能對人類構成生存威脅。

　　然而，在一些人工智能研究人員看來，人類正處于人工智能爆炸的邊緣，這一觀點似乎很可笑。

　　微軟公司位于英國劍橋的研究總監(jiān)ChrisBishop強調了當今狹義人工智能與通用人工智能之間的不同。他說，“人們擔心終結者和機器的崛起?這是胡說八道，這樣的討論應該是幾十年后的事了?！?/FONT>

人工智能會替代人類的工作嗎?

　　在不久的將來，人工智能系統(tǒng)取代大部分體力勞動的可能性可能更可信。人工智能系統(tǒng)替代許多體力勞動人員的可能性也許是更可靠的說法。

　　雖然人工智能不會取代所有的工作，但似乎可以肯定的是，人工智能將改變工作的性質，唯一的問題是自動化將如何快速和深刻地改變工作場所。

　　人工智能在各個領域都具有影響呼。正如人工智能專家AndrewNg所說：“很多人都在做常規(guī)的重復性工作。不幸的是，技術尤其擅長于自動化日常的重復性工作。因此未來幾十年技術失業(yè)的風險很大?！?/FONT>

　　有證據(jù)表明哪些工作崗位將被取代。美國現(xiàn)在有27家AmazonGo無需收銀臺的超市，顧客只需從貨架上取下商品走出店門就可以完成交易。這對美國300多萬收銀員意味著什么還有待觀察。亞馬遜公司在使用機器人提高倉庫效率方面處于領先地位。這些機器人將貨架的物品運送給揀貨人員，揀貨人員選擇要發(fā)送的物品。亞馬遜公司在其運營中心擁有超過20萬個機器人，并計劃增加更多機器人。但是亞馬遜公司還強調，隨著機器人數(shù)量的增長，這些倉庫中的工作人員也隨之增加。但是，亞馬遜和小型機器人公司正在努力使倉庫中剩余的體力勞動實施自動化，因此，體力勞動和機器人勞動將繼續(xù)齊頭并進并不是假設。

　　全自動無人駕駛汽車現(xiàn)在還沒有成為現(xiàn)實，但根據(jù)一些預測，即使不考慮對快遞員和出租車司機的影響，僅自動駕駛卡車行業(yè)就可能在未來十年內替代170萬個工作崗位。

　　然而，一些容易實現(xiàn)自動化的工作甚至不需要機器人技術。目前有數(shù)以百萬計的人從事行政工作，在系統(tǒng)之間輸入和復制數(shù)據(jù)，追蹤和預訂公司的約會。隨著軟件能夠更好地自動更新系統(tǒng)并標記重要信息，因此對管理員的需求將下降。

　　與每項技術變革一樣，人工智能將創(chuàng)造新的工作崗位來替代失去的工作崗位。但是，不確定的是這些新角色是否會迅速為失業(yè)者提供就業(yè)機會，以及這些失業(yè)者是否具有必要的技能或能力來填補這些新興角色。

　　并非每個人都是悲觀主義者。對于某些人來說，人工智能是一種可以提高工作能力而不是替代工作人員的技術。不僅如此，而且他們認為沒有必要采用人工智能，因為人工智能輔助工作人員比人工智能系統(tǒng)工作效率更高或更有效，因為他們可以在人工智能系統(tǒng)提出要求之前，準確地告訴他們客戶想要什么。人工智能專家關于人工智能系統(tǒng)將以多快的速度超越人類的能力有著廣泛的看法。

　　牛津大學人類未來研究所邀請了幾百位機器學習專家來預測未來幾十年人工智能的能力。

　　他們總結出來的未來值得注意的事項包括：到2026年，人工智能撰寫的文章將被認為是人類所寫的文章、2027年卡車司機被大量裁員、2031年人工智能在零售業(yè)超過人類能力、人工智能將在2049年寫出暢銷書，到2053年人工智能將完成外科醫(yī)生的工作。

　　他們估計人工智能在45年內擊敗人類完成所有任務的可能性相對較高，在120年內實現(xiàn)所有人類工作的自動化。

（轉載）

標簽：人工智能

我要反饋