從2017年開始,斯坦福大學(xué)的以人為本人工智能研究所(HAI)每年都會(huì)發(fā)布AI指數(shù)報(bào)告,試圖全面追蹤AI領(lǐng)域的最新發(fā)展動(dòng)態(tài)和趨勢。
上周,斯坦福大學(xué)發(fā)布了2022年的AI指數(shù)報(bào)告,報(bào)告長達(dá)190多頁,涵蓋了研發(fā)、技術(shù)績效、倫理、政策、教育和經(jīng)濟(jì)等方面,旨在成為世界上最可信、最權(quán)威的AI數(shù)據(jù)和洞察來源。
為了方便大家更直觀地了解行業(yè)發(fā)展?fàn)顟B(tài),IEEE Spectrum閱讀了報(bào)告全文,并選出了最具代表性的12張圖表。下面一起來看看這份總結(jié)報(bào)告吧:
全球企業(yè)對人工智能的投資(按投資活動(dòng)分類)
涌入人工智能領(lǐng)域的投資資金大幅上升,從2020年的1195億美元增長到了2021年的1764億美元。其中最矚目的增長來自全球私人投資,它從2020年的460億美元飆升至2021年的935億美元。這一增長來自于大規(guī)模融資的增加:2020年超過5億美元的融資有4輪,2021年有15輪。報(bào)告還指出,所有這些資金都流向了更少的公司,因?yàn)樽?018年以來,新獲資助的初創(chuàng)公司數(shù)量一直在下降。所以,現(xiàn)在是一個(gè)加入人工智能初創(chuàng)公司的好時(shí)機(jī),但也許不是創(chuàng)業(yè)的好時(shí)機(jī)。
跨國合作的人工智能出版物
從2010年到2021年,中美在AI出版物方面的合作數(shù)量增長了5倍,居全球榜首。斯坦福大學(xué)HAI的政策研究員、2022 AI指數(shù)報(bào)告的主編Daniel Zhang說:“過去10年,兩國合作一直呈上升趨勢。”在跨國合作的出版物方面,中美兩國的產(chǎn)出數(shù)量是第二名中英兩國數(shù)量的兩倍多。
按申請狀態(tài)和地理區(qū)域劃分的人工智能專利
報(bào)告指出,中國在2021年的AI專利申請量占全球總數(shù)的52%,專利申請數(shù)量居世界首位。美國在授權(quán)專利數(shù)量上占全球總數(shù)的40%,排名世界第一。Daniel Zhang表示,獲得專利授權(quán)“證明你的專利實(shí)際上是可信并且有用的”,這種情況有點(diǎn)類似于出版物和引用的情況。雖然中國發(fā)表了最多的AI會(huì)議出版物,但美國的AI會(huì)議出版物引用次數(shù)最多,這表明美國研究人員的知名論文仍然具有巨大的影響力。
視覺常識推理(VCR)任務(wù):Q→AR 得分
計(jì)算機(jī)視覺領(lǐng)域一直在快速發(fā)展,AI指數(shù)顯示,計(jì)算機(jī)視覺系統(tǒng)非常擅長處理涉及靜態(tài)圖像的任務(wù),例如對象分類和面部識別,在視頻任務(wù)(例如活動(dòng)分類)方面也越來越出色。
但是一個(gè)相對較新的基準(zhǔn)顯示了計(jì)算機(jī)視覺系統(tǒng)所能做的極限:它們擅長識別事物,但不太擅長對所看到的進(jìn)行推理。視覺常識推理挑戰(zhàn)于2018年推出,要求人工智能系統(tǒng)回答有關(guān)圖像的問題,并解釋它們的推理。例如,一張圖片顯示人們坐在餐廳的桌子旁,一個(gè)服務(wù)員端著盤子走過來,這個(gè)測試問為什么一個(gè)坐著的人指著桌子對面的人。該報(bào)告指出,近年來針對性能的改善越來越少,因此需要發(fā)明新技術(shù)來顯著提高性能。
需要邏輯推理的閱讀理解數(shù)據(jù)集(RECLOR):準(zhǔn)確性
自然語言處理(NLP)領(lǐng)域比計(jì)算機(jī)視覺晚了幾年才開始蓬勃發(fā)展,但它的地位與計(jì)算機(jī)視覺有些相似。在文本摘要和基本閱讀理解等任務(wù)的基準(zhǔn)測試中,人工智能系統(tǒng)的表現(xiàn)經(jīng)常超過人類,但在要求NLP系統(tǒng)對它們所讀內(nèi)容進(jìn)行推理時(shí),它們就遇到了麻煩。
這張圖表顯示了法學(xué)院入學(xué)考試(LSAT)中的邏輯推理題在基準(zhǔn)測試中的表現(xiàn)。雖然NLP系統(tǒng)在一組較簡單的問題上表現(xiàn)良好,但表現(xiàn)最佳的模型在一組較難問題上的準(zhǔn)確率僅為69%。當(dāng)研究人員要求NLP系統(tǒng)從不完整信息進(jìn)行推理時(shí),也得到了類似的結(jié)果,說明邏輯推理仍然是人工智能的一個(gè)前沿領(lǐng)域。
按隸屬關(guān)系分類的FAccT會(huì)議投稿被接受的數(shù)量
報(bào)告帶來了一個(gè)好消息:從ACM公平、問責(zé)和透明度會(huì)議(FAccT)以及NeurIPS倫理學(xué)相關(guān)研討會(huì)等會(huì)議的參與情況來看,現(xiàn)在人們對人工智能倫理學(xué)有很大的興趣。報(bào)告指出,F(xiàn)AccT是最早關(guān)注算法社會(huì)技術(shù)分析的主要會(huì)議之一,這張圖表顯示越來越多的行業(yè)參與到FAccT中,Daniel Zhang認(rèn)為這是進(jìn)一步的好消息。他說:“這個(gè)領(lǐng)域一直由學(xué)術(shù)研究人員主導(dǎo),但現(xiàn)在我們看到更多的私營部門參與進(jìn)來。”Daniel Zhang表示,很難猜測這種參與對人工智能系統(tǒng)在行業(yè)內(nèi)的設(shè)計(jì)和部署意味著什么,但這是一個(gè)積極的信號。
Perplexity:少數(shù)民族群體英語“解毒”后的語言模型表現(xiàn)
大型語言模型是人工智能中一個(gè)重要的倫理問題,比如OpenAI的GPT-3。它有一個(gè)非常棘手的問題,就是把從訓(xùn)練數(shù)據(jù)(互聯(lián)網(wǎng))中學(xué)到的所有消極語言和有害偏見,都集中在生成的文本中。多個(gè)研究小組(包括OpenAI本身)正致力于解決這一“有毒”的語言問題,并制定了衡量偏見的新基準(zhǔn)和“解毒”方案。但在上圖中,顯示了通過三種不同“解毒”方法運(yùn)行語言模型GPT-2的結(jié)果。所有這三種方法都損害了模型在一個(gè)名為Perplexity指標(biāo)上的性能(得分越低越好),對涉及非裔美國人的英語和提到少數(shù)群體的文本,其表現(xiàn)影響最差。正如專家們喜歡說的那樣,這還需要更多的研究。
北美博士生機(jī)構(gòu)新畢業(yè)的CS本科生人數(shù)
人工智能領(lǐng)域的人才越來越多。計(jì)算研究協(xié)會(huì)的年度調(diào)查收集了北美200多所大學(xué)的數(shù)據(jù),其最新數(shù)據(jù)顯示,2020年,超過31,000名本科生完成了計(jì)算機(jī)科學(xué)學(xué)位,比2019年增加了11.6%。
北美地區(qū)新增女性AI和CS博士(占新增總數(shù)的百分比)
同一項(xiàng)調(diào)查研究了人工智能領(lǐng)域的新博士,結(jié)果讓人十分沮喪。在過去的十年里,北美女性AI和CS博士的比例只增加了幾個(gè)百分點(diǎn)。這一點(diǎn)在去年的報(bào)告里也提過,但我們應(yīng)該一直談?wù)撍钡绞虑榘l(fā)生變化。
美國居民中新的計(jì)算機(jī)博士,按種族/族裔劃分的(總數(shù)占比)
上表按照種族/族裔劃分,統(tǒng)計(jì)了美國居民中新增計(jì)算機(jī)博士的比例。數(shù)據(jù)顯示,新增人數(shù)中有57.5%的白人,亞洲人占24.8%。除此之外,不乏部分來自未知種族、西班牙裔、非洲裔、土著背景的計(jì)算機(jī)博士。這也說明,AI領(lǐng)域需要在多樣性工作上做得更好,AI需要各種種族背景的人才。
25個(gè)選定國家中,AI相關(guān)法案通過為法律的數(shù)量
2021年,與人工智能相關(guān)的法案比以往任何時(shí)候都多,數(shù)量增加到了18項(xiàng)。AI指數(shù)報(bào)告對25個(gè)國家的立法記錄進(jìn)行了分析,發(fā)現(xiàn)西班牙、英國和美國處于領(lǐng)先地位,去年分別通過了三項(xiàng)法案。但報(bào)告中沒有明確說明,這些法案主要是通過公共資金促進(jìn)人工智能,還是制定法規(guī)來管理人工智能可能帶來的風(fēng)險(xiǎn)。對此,Daniel Zhang表示,HAI將在來年發(fā)布一個(gè)更詳細(xì)的全球立法分析。
按主題列出的AI相關(guān)政策文件數(shù)量(總部設(shè)在美國的組織)
人工智能指數(shù)跟蹤了美國55個(gè)發(fā)表人工智能相關(guān)論文的公共政策團(tuán)體,并統(tǒng)計(jì)了這些團(tuán)體去年關(guān)注的主題。從上圖可以看出,AI對隱私安全、創(chuàng)新技術(shù)、倫理、行業(yè)法規(guī)等方面關(guān)注度最高,但對環(huán)境和氣候變化方面卻很少關(guān)注。
IEEE Spectrum就這張圖表,提出了人工智能越來越大的能源足跡(訓(xùn)練大模型需要大量的計(jì)算時(shí)間)對氣候變化的潛在影響,并就此問了Daniel Zhang:AI指數(shù)是否會(huì)在明年的報(bào)告中討論這些問題。Daniel Zhang表示,自己和團(tuán)隊(duì)正在與各種組織討論如何衡量以及收集計(jì)算效率和氣候影響的數(shù)據(jù)。所以,請繼續(xù)關(guān)注。
更多細(xì)節(jié),詳見報(bào)告原文:https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf
參考鏈接:12 Graphs That Explain the State of AI in 2022 - IEEE Spectrum
關(guān)鍵詞: 專利申請量