siemens x
人工智能

阿里提供中文搜索新選項!AI引擎+達摩院黑科技,你要試試嗎?

2025China.cn   2020年06月16日

  最近中文搜索引擎市場又突然熱了起來,一家巨頭的入場讓外界充滿期待。

  6月9日,阿里向外界確認成立智能搜索業(yè)務(wù)部,隸屬阿里創(chuàng)新業(yè)務(wù)事業(yè)群,由UC事業(yè)部總經(jīng)理、書旗事業(yè)部總經(jīng)理吳嘉擔任負責人。

  阿里人事變動,莫非要進軍搜索引擎市場?其實阿里的產(chǎn)品早已先行。

  今年4月,一款名為“夸克”的智能搜索App首次在蘋果應(yīng)用商店排名超越百度,并首次躋身前20。

  其實早在2018年,夸克就開始發(fā)力智能搜索,2019年1月,夸克發(fā)布3.0版,在自主訂制的AI搜索引擎、搜索直達、指令控制等方面實現(xiàn)了重要升級。

  搜索引擎誕生已有20余年,無論國內(nèi)外,市場似乎早已塵埃落定,阿里為何如此“頭鐵”,夸克為何近兩年來越來越進擊智能搜索?

  這恐怕與近年來AI成熟落地密不可分,也不得不從搜索行業(yè)的變化開始說起。

多模態(tài)搜索的變革

  PC時代,我們以文字作為主要的搜索形式。移動互聯(lián)網(wǎng)興起后,手機端的搜索引擎App依然如此。

  后來,智能手機開始普及,說一段話、拍一張圖變得容易起來,各大搜索引擎公司又加入了語音、圖片搜索。

  如果我們仔細思考就會發(fā)現(xiàn),現(xiàn)階段大多數(shù)語音、圖片搜索,其實本質(zhì)上還是把多媒體信息轉(zhuǎn)變成文字,然后再進行搜索。

  這類搜索只是理解用戶輸入的信息,實際上對另一端抓取的信息是沒有理解的??淇艘龅木褪翘鲞@種機械文本檢索的圍墻,改變搜索引擎。

  在吳嘉看來,這次的轉(zhuǎn)變是一場搜索引擎的真正變革。

  吳嘉認為,今天的內(nèi)容生態(tài)有很大的變化,搜索技術(shù)也應(yīng)該擁抱相應(yīng)的變化。

  至少在語音、圖像理解的搜索上,夸克背后的阿里已經(jīng)擁抱變化。淘寶的圖片搜索技術(shù)早已在移動端得到應(yīng)用,天貓精靈也是國內(nèi)智能音箱領(lǐng)域的頭部玩家。

  在夸克的產(chǎn)品中,也有這兩類智能搜索技術(shù)的體現(xiàn)。

  那么未來的多模態(tài)搜索又會怎樣?

  夸克的判斷是,未來搜索很大程度上會是視頻內(nèi)容檢索。注意不是對標題的搜索標題,而是對視頻內(nèi)容本身。

  隨著短視頻這種娛樂、學習方式的興起,傳統(tǒng)的搜索方式變得無效,因為它不能對視頻內(nèi)容做出理解。

  而這正是夸克在今天做的工作。

  據(jù)夸克搜索技術(shù)負責人介紹,他們正在做視頻理解——深入到視頻每一幀畫面、每一句語音里,去分析這個視頻的主題和質(zhì)量,然后在分析的結(jié)果上建設(shè)一個視頻庫。

  將來用戶只要一搜,就能把現(xiàn)在最好最熱門的視頻內(nèi)容返回給用戶,提升用戶在視頻搜索上的體驗。

  這項技術(shù)離我們不會太遙遠。夸克產(chǎn)品負責人鄭嗣壽透露,夸克將在不久后就會這樣的視頻搜索產(chǎn)品。

夸克為何要做搜索

  通過搜索框和AI,我們初步了解了夸克產(chǎn)品??墒窃谛畔⒐聧u化的今天,有人認為通用搜索已死,夸克為何還要做搜索?

  因為在夸克團隊看來,通用搜索不但不會死,未來的價值還會越來越重要。

  而且,直到今天,搜索引擎一直是互聯(lián)網(wǎng)的基礎(chǔ)服務(wù)之一,每天國內(nèi)就有數(shù)億用戶在用。

  只要用戶有需求,通用搜索就會一直存在。

  吳嘉在接受采訪時說,過去我們的搜索內(nèi)容在鏈接里、在H5里,但是今天想做好一個內(nèi)容,已經(jīng)沒有現(xiàn)成的鏈接和H5可供抓取了。

  只有把要把內(nèi)容生態(tài)做起來,同時提高技術(shù),搜索引擎才有出路。

  生態(tài)方面,夸克不必擔心,有阿里的電商和大文娛內(nèi)容有阿里的生態(tài)內(nèi)容作為支持。

  而更重要的是有AI搜索還有對內(nèi)容的理解,從海量化信息中把有價值的信息呈現(xiàn)給用戶。在這方面,夸克有自然語言理解AI技術(shù)幫助提取有效信息。

夸克為何有底氣做好搜索

  無疑,阿里的中臺架構(gòu)幫助夸克在一年內(nèi)快速實現(xiàn)智能搜索的愿景。

  產(chǎn)品負責人嗣壽自豪地說:“阿里的基礎(chǔ)設(shè)施建設(shè)是非常完善的,算力也有很大的優(yōu)勢,在這里可以實現(xiàn)更先進的算法?!?/FONT>

  在技術(shù)方面,夸克搜索技術(shù)負責人向我們介紹,夸克在自然語言理解、知識圖譜、多模內(nèi)容理解方面都有大量投入:

  1、在過去一年多的時間里,夸克構(gòu)建了超大規(guī)模的基礎(chǔ)的閱讀理解的數(shù)據(jù)集,為網(wǎng)頁搜索提供了段落級、句子級、單詞級別不同粒度的閱讀理解技術(shù)。

  2、抽取網(wǎng)頁文本的知識,將其與結(jié)構(gòu)化的知識做融合,構(gòu)建知識體系。目前已經(jīng)在醫(yī)療類搜索中得到應(yīng)用。

  3、最后就是之前提到的對視頻內(nèi)容的理解。

  除了搜索的基礎(chǔ)技術(shù)外,夸克還在AR、VR圍繞這些交互方式上有非常多的探索。

  作為阿里前沿技術(shù)的大腦,達摩院也為夸克輸送了大量的技術(shù)。

  前不久達摩院提出的StructBERT,在通用語言理解評估基準GLUE上超過了谷歌、微軟,排名第一。

  這篇研究成果也被國際頂級AI學術(shù)會議ICLR 2020收錄,夸克團隊也很快將這項技術(shù)用到自己的搜索產(chǎn)品當中來。

  去年谷歌將BERT用于文字搜索,大大提高搜索結(jié)果的準確性,夸克在方面緊跟國外前沿公司的潮流。

  技術(shù)以人為本,以上的技術(shù)離不開夸克團隊內(nèi)部人才的吸引和培養(yǎng)機制。

  現(xiàn)在的團隊中也有很多搜索行業(yè)的老兵,他們分別來自各大互聯(lián)網(wǎng)頂級公司。

  據(jù)夸克搜索技術(shù)負責人介紹,現(xiàn)在的搜索技術(shù)團隊,最初來自于阿里的多個業(yè)務(wù)領(lǐng)域的技術(shù)團隊,之前研究過聊天機器人、智能問答等技術(shù)場景,后來還參加過智能音箱相關(guān)技術(shù)的研發(fā)。

  技術(shù)團隊不是天生為搜索,但是卻與現(xiàn)在的智能搜索技術(shù)緊密關(guān)聯(lián)。

  面對瞬息萬變的搜索市場,夸克也在及時獲取新鮮血液,有很多入職不到兩三年的新阿里人漸漸加入到當中來,不斷壯大團隊。

  雖然夸克的完成度已經(jīng)很高,但是未來還有很大的提升空間,尤其是視頻搜索、交互模式等方面。這離不開更多新人的加入。

  嗣壽希望,能夠更多年輕人加入夸克,夸克的AI研發(fā)崗位會一直向頂尖技術(shù)人才敞開,為做出更好中文搜索引擎的愿景一起努力。(文章來源:量子位)

(轉(zhuǎn)載)

標簽:阿里 AI引擎 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]