Hi,歡迎來到黃頁88網!
當前位置:首頁 > 搜索引擎 > 360搜索在人工智能時代何去何從

360搜索在人工智能時代何去何從

互聯網時間: 2023-07-11 15:19:58

今年初,智能對話機器人模型ChatGPT引發了全球范圍的人工智能熱潮。面對這波浪潮,國內的科技公司,尤其是搜索引擎領域的巨頭們紛紛加入,相繼發布自己的大模型。

作為國內第二大搜索引擎廠商,360近期就官宣發布了360GPT產品矩陣“智腦”,成為針對搜索場景,國內較先推出的應用GPT技術的新一代智能搜索。

據了解,該產品已正式開放產品內測。隨著越來越多的場景應用,人工智能將帶來哪些新的生產力變革?但可以確定的是,人工智能真正走進我們工作生活的時代已經正式開啟。 

1.生產力迎來大變革時代,360落地新搜索應用

隨著微軟將ChatGPT與Bing的融合,讓搜索引擎成為生產力改造的前沿陣地。

這種結合讓搜索引擎迎來了全新的發展方向,而ChatGPT正改變著信息生產、組織和獲取的方式。對此,我們與360相關業務的技術負責人張向征聊了聊,他表示,ChatGPT的出現證明了通過“大模型+搜索引擎”可以讓AI實現以往無法企及的 “智能”。這將對搜索行業產生深遠的影響,甚至引發生產力的變革。

在國內,有資格進行相關探索的公司不多。

360作為國內第二大搜索引擎廠商,憑借多年的數據、算力和工程能力,以及在人工智能領域的深厚積淀,前不久推出了自研的360GPT產品矩陣“智腦”,同時也是頭一批落地到搜索應用產品中,引起了業界的普遍關注。

傳統的搜索一般是以網頁鏈接形式為結果,用戶需要自己一個個翻找鏈接,進入網頁尋找答案。而結合了360GPT能力的360新搜索可以通過問答的形式,根據用戶提出的問題直接生產內容。

基于360GPT的新搜索生成式對話截圖

針對“為什么淄博燒烤突然火了?”這個當下的熱點話題,很快就給出了答案。列出了淄博燒烤最新的社會事件,還提煉分析直接給出了結論。不僅如此,回答中還顯示了援引來源,可以供用戶溯源確認??梢钥吹降氖?,360新搜索的問答更符合人的自然表達,生成的內容也遠比傳統搜索更直接、更豐富。

究其原因,張向征介紹說:“我們一直把理解用戶目的、便捷用戶使用當成了重要的產品研發方向,基于360GPT的新搜索擁有更強大的閱讀理解能力?!?/p>

另一方面,人工智能相關內容的生產離不開真實可靠的信息。通過聯網搜索能力,實現了于全網信息的高效互聯,及時獲得準確、有效的信息,再憑借生成式大語言模型對信息的提煉、總結和生成能力,快速給出兼具時效性和可讀性的答案。

“大模型+搜索引擎兩者融合的產品更像用戶的個人助手,交互模式會更多樣,能力邊界也會顯著擴大”。張向征透露,以用戶需求為出發點,360GPT還將與瀏覽器、數字助理、蘇打辦公、智能營銷等場景應用深度結合,為用戶提供多元化的智能服務。

2、多年布局人工智能,技術場景“兩翼齊飛”

早在2015年深度學習技術風靡時,人工智能就已是搜索行業變革的重要推動力。

2017年,NLP領域劃時代的Transformer算法誕生。沿著Transformer的路徑,GPT、BERT等新技術,將機器視覺領域的訓練方式用于自然語言領域,實現了“智能化”的進一步升級。

對比GPT與BERT來看,GPT是一個單向模型,更擅長“寫作文”,而BERT是雙向模型,可以聯系上下文進行分析,更擅長“完形填空”。因此,相比較于GPT,對于圍繞已存在內容展開業務的搜索引擎行業來說,BERT是更常用的模型。

BERT和GPT模型結構對比

BERT和GPT模型結構對比(來源:BERT論文)

而ChatGPT的出現帶來了技術路線的大變動。

張向征表示,人工智能技術一直是360搜索不斷進化的關鍵,ChatGPT作為一種新形式的后端變革,將影響后續搜索引擎底層技術的調研和技術的應用方式。

他介紹道,2015年,360搜索就開始用深度學習模型進行搜索的召回、排序以及Query意圖識別等關鍵環節。之后,360搜索又開始使用多模態檢索模型,來多元化搜索形態,適應圖片搜索等新需求。

到2019年,360搜索完成了對BERT模型的初版應用,2020年完成BERT的全流量在線部署和應用。此時,360搜索已經開始做“閱讀理解”。不同于僅提供鏈接,針對某些已經有明確答案的問題,360搜索可以抽取精準答案所對應的段落和句子,并直接展示在搜索頁。

“也正是這些探索打下的基礎,今天我們才有了自己的生成式大語言模型和產品矩陣‘智腦’”。張向征這樣說。

眾所周知,搜索引擎的核心是底層的技術能力以及優質的內容和服務。因此,搜索引擎未來的產品形態、交互模式、展現方式等都將基于其核心能力,再根據用戶的習慣和偏好不斷變化。未來的搜索引擎將形成全新的入口,搜索能力會繼續存在,并承擔相應的后臺支持功能。

人類獲取信息的方式的變革蘊含著巨大的機會??梢韵胍?,基于360GPT的新一代的智能搜索引擎將承載更多的用戶使用場景,也將迎來更大的想象空間。

3.“未來搜索引擎”已至,360搜索的底氣從何而來?

據了解,從2012年成立之初,360搜索就以其獨特的產品和技術實力,構筑起了差異化的市場定位。

依托于360集團,360搜索在安全層面積累深厚。借助于旗下產品對于病毒、釣魚網站等的識別與攔截能力,360搜索可以及時過濾風險,為用戶打造更安全、穩定的上網環境。

另一方面,隨著各種垂直平臺的興起,互聯網內容開始“孤島化”。作為全網搜索平臺,360搜索始終堅持開放的發展策略。

360搜索一直以來都重視對內容生態的建設。目前,360已經與多個內容平臺達成合作,所有內容提供方均參與收入分成,逐步形成了互惠共享的生態環境。

此外,360搜索還在搜索的數據、算法、工程化能力以及服務接口對內對外雙向賦能,更大范圍地觸達用戶群體。

對內,360推出的日歷等訂閱產品,就融合了360搜索的功能,用戶一鍵訂閱,就能實時收到最新的信息更新。對外,360搜索入局SaaS業務,通過為某些垂直領域的搜索平臺提供SaaS化的接口,來輸出其全網搜索能力。

與此同時,360搜索也在持續加筑自身護城河,緊隨GPT大語言模型,360搜索借助其人工智能技術的積累,利用360“智腦”探索產品邊界,推出新一代智能搜索。

業界有一個普遍的共識,那就是ChatGPT的性能卓越主要源于其預訓練模型參數量巨大,人工反饋為主的標注強化學習手段,以及先進的思維模式訓練方法。從GPT-1到GPT-3,模型訓練的參數量呈千倍增長,已達到接近2000億的量級。在數據量達標,用大模型把知識容量、基礎通用能力做的足夠高之后,大模型研發就要面臨工程落地環節。這需要耗費巨大的訓練和推理成本,也是“英雄折戟”之地。

模型規模不等于符合實際需要,為了避免無意義回答,還要為人工智能加上“傾向性”,這就用到RLHF新技術,即基于人類反饋的強化學習,通過人工標注來加入方向性引導。最后,思維訓練也是人工智能的一部分,要使其具備推理能力,能進行高度擬人化的多輪對話。

除了以上難點,GPT大語言模型要真正落地,還要結合對實際業務的理解。這將是一個逐步改進,不斷摸索的過程。

在巨大的壁壘面前,360有著“先天優勢”,360搜索的內容涵蓋全網數據,抓取過的網頁數已達上萬億,現存網頁數達數千億,索引的網頁達數百億,這能為技術開發提供足夠多的語料。

從數據多樣性上來看,360搜索不局限于某一類別的數據,而是對電商、新聞、小說、問答、百科等各類數據均有覆蓋,保證了數據集的完整度。

BERT和GPT模型結構對比

360搜索基于圖像AI識別能力推出了“圖查查”平臺

文本數據之外,360搜索還利用多模態搜索技術,通過識別文本和圖像間的映射關系,將語料信息延伸到更豐富的形態中。

據了解,360搜索已經積累了數百億的圖片信息。2022年,360搜索還聯合360人工智能研究院與清華大學,推出了中文圖文跨模態數據集Zero和圖文跨模態預訓練框架R2D2。

其中,Zero包括兩個預訓練數據集和五個下游任務數據集,預訓練數據集包括2300萬和230萬兩個版本,該數據集也是國內開源的首個中文圖文跨模態領域數據集。

360搜索聯合360人工智能研究院、清華大學推出的中文圖文跨模態數據集Zero

當然,僅有大規模數據集還遠遠不夠。要形成有效的語料集,對各類信息進行篩選和清理同樣重要,這就需要扎實的人工智能工程能力。

張向征表示,任何人工智能技術的落地都離不開工程能力,也就是讓人工智能技術以低成本、高效率的方式落地實施的能力。

基于多年深耕,360內部在模型訓練平臺、預訓練語言模型等方面,已經積累了豐富的經驗,能為GPT大語言模型的開發提供良好的工程支持,有效降低訓練推理和業務落地的成本。

早在幾年前,360搜索就已經把所有的底層文檔,以向量形式表達,能快速鎖定、提取內容,進一步提高檢索和篩選的效率。同時,結合用戶的搜索反饋,360搜索能有效判斷不同信息的重要性,進一步提高語料集的質量。

此外,人工智能的持續商業化落地,也離不開充足算力的支持。360內部部署的數萬臺服務器、數百臺GPU,已成為相關研究所需算力的有力支撐。

從數據到算力,再到工程能力,正是360集團一直以來對人工智能的重視,形成了今天360搜索探索未來搜索引擎的充足底氣。

4、從基礎研究到上層應用,360集團奔向人工智能的“星辰大?!?/strong>

平行于360搜索,360集團設立了360人工智能研究院。

據了解,360人工智能研究院專門進行人工智能基礎模型和前瞻性技術的研究,現階段主要聚焦于研發業界領先的計算機視覺、深度自然語言理解,語音語義交互等人工智能技術,再將研究成果應用于智慧物聯網(IOT)、智能安全大數據,互聯網信息分發等多種場景。

其研究范圍涵蓋人工智能各主要領域,申請專利數接近400件。團隊核心成員還曾于2017年在有“計算機視覺屆世界杯”之稱的ImageNet比賽中獲得兩項冠軍,并刷新了谷歌、微軟保持的世界紀錄。在2019-2021年的中國人工智能大賽中,360人工智能研究院更是取得3連冠。

此外,團隊還參與了國家級重點大數據工程實驗室和國家新一代人工智能創新發展試驗區開放實驗室的建設,其主導項目也已入選“科技部科技創新2030項目”和“吳文俊人工智能科技進步獎”。

張向征表示,人工智能研究院主要提供底層研究支持,360搜索在內的各業務部門,則負責將人工智能與業務場景相結合,同時將實踐結果反饋給研究院,形成了基礎研究到上層應用的生態閉環。

目前,360已經搭建起了數百人的人工智能研發團隊,并廣招人工智能人才,每年的研發投入也均以億級計算。

接下來,360搜索將與360人工智能研究院緊密合作,不斷強化新一代搜索引擎的能力邊界,不斷探索人工智能技術在瀏覽器、數字助理、蘇打辦公、智能營銷等多場景的應用結合,奔向GPT大語言模型的“星辰大?!?。

本文標題: 360搜索在人工智能時代何去何從

本文地址: http://www.yhjdp.com/brand/news-38330b793b.html

內容均來源于網絡,錯誤糾正或刪除請發郵件,收件郵箱kefu@huangye88.com

熱門推薦企業

2009-2023 黃頁88版權所有 京ICP備2023012932號-1京公網安備 11010802023561號 京ICP證100626

內容均來源于網絡,錯誤糾正或刪除請發郵件,收件郵箱kefu@huangye88.com

欧美大涨