第一經(jīng)濟(jì)網(wǎng)歡迎您!
        當(dāng)前位置:首頁>金融動態(tài) > 正文內(nèi)容

        “百模”爭舸:群雄逐鹿的野心和背后的冷思考 當(dāng)前頭條

        21世紀(jì)經(jīng)濟(jì)報道記者 蔡姝越 杭州報道

        在生成式AI的大浪潮下,各路AI大模型已然形成群雄逐鹿的局面。


        (資料圖)

        今年以來,百度、阿里、華為、京東、360、網(wǎng)易等國內(nèi)互聯(lián)網(wǎng)廠商,爭相公布了旗下的大模型布局。在眾多廠商展開大模型“軍備競賽”,并紛紛落地應(yīng)用之時,有哪些技術(shù)熱點(diǎn)值得深入關(guān)注?國內(nèi)大模型的未來發(fā)展趨勢如何?

        5月31日,依托中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟、人工智能關(guān)鍵技術(shù)和應(yīng)用評測工信部重點(diǎn)實驗室,由中國信通院聯(lián)合人工智能工程化推進(jìn)委員會大模型工作組、生成式人工智能工作組主辦的“大模型技術(shù)應(yīng)用”分論壇,于5月31日在杭州夢想小鎮(zhèn)互聯(lián)網(wǎng)村正式舉辦。

        論壇中,多位產(chǎn)學(xué)界人士對目前國內(nèi)大模型的現(xiàn)狀進(jìn)行了分析,聚焦大模型、生成式AI、對話式AI、知識計算、智能決策等多個熱點(diǎn)技術(shù),深入探討相關(guān)技術(shù)、產(chǎn)品、生態(tài)等發(fā)展趨勢。

        高速發(fā)展下的新機(jī)遇

        “百模”大戰(zhàn)揭開帷幕,各領(lǐng)域AI大模型先后發(fā)布。大模型正從效率、質(zhì)量、個性化等方面為內(nèi)容生產(chǎn)帶來改革,不斷解放生產(chǎn)力。

        其中,“涌現(xiàn)性”是生成式AI大模型的一大關(guān)鍵優(yōu)勢。“原本訓(xùn)練AI,可能需要人類‘手把手’去教學(xué),機(jī)器才能學(xué)會某項技能。但在當(dāng)下的發(fā)展階段,在不與AI交互的前提下,這項技術(shù)也能夠進(jìn)行自主學(xué)習(xí)。AI技術(shù)所具備的‘涌現(xiàn)性’,也是它的一項突破性進(jìn)展。”聲智科技數(shù)智人產(chǎn)品副總裁黃赟賀在發(fā)言中指出。

        據(jù)悉,目前AI大模型的架構(gòu)主要分為兩種,一種是Decoder-only(僅解碼器),這一類架構(gòu)的優(yōu)勢在于可以更容易完成文本生成任務(wù),主流大模型如OpenAI開發(fā)的GPT系列、英偉達(dá)開發(fā)的Megatron-LM等均是采用此架構(gòu)。另一種架構(gòu)是Eecoder-Decoder(編碼器-解碼器),該架構(gòu)可以更靈活地適應(yīng)不同長度和不同類型的輸入和輸出序列,從而適應(yīng)多種自然語言處理任務(wù),谷歌研發(fā)的T5模型便屬于此架構(gòu)。

        阿里達(dá)摩院機(jī)器智能技術(shù)創(chuàng)新業(yè)務(wù)中心負(fù)責(zé)人陳海青指出,許多大模型利用Decoder-only架構(gòu)訓(xùn)練效率高的優(yōu)勢,使得底層數(shù)據(jù)量能夠迅速擴(kuò)展到龐大的規(guī)模。

        以GPT為代表的大模型在近年來的快速演進(jìn)和迭代,成為了該領(lǐng)域火熱發(fā)展的縮影。在GPT1到GPT3的發(fā)展過程中,底層數(shù)據(jù)量從1億飆升至萬億級別。“該模型每年平均有10倍的參數(shù)量變化,也成為了智能時代的‘摩爾定律’。”他說。

        “大模型加速了通用人工智能時代的到來。而行業(yè)級大模型以及應(yīng)用,其實是一個非常好的創(chuàng)業(yè)機(jī)會點(diǎn)。”百應(yīng)科技技術(shù)負(fù)責(zé)人吳凱表示。他認(rèn)為,一家科技型企業(yè),技術(shù)和產(chǎn)品始終是企業(yè)的生命線,這就需要持續(xù)學(xué)習(xí)、不斷加強(qiáng)人工智能的技術(shù)深挖。

        因此,當(dāng)一項新技術(shù)誕生并高速發(fā)展時,能否快速學(xué)習(xí)并深度應(yīng)用,對于眾多科技企業(yè)而言是一個“優(yōu)勝劣汰”的過程。

        拓爾思副總裁尹世杰指出,垂直場景落地正成為“百模大戰(zhàn)”核心角力點(diǎn)。在垂直領(lǐng)域,模型基座、高質(zhì)量數(shù)據(jù)、專業(yè)領(lǐng)域Know-How、真實場景閉環(huán)及用戶反饋,是專業(yè)大模型成功的5大要素。

        “百模”大戰(zhàn)下的冷思考

        “在我制定(今天的)演講題目時,‘百模大戰(zhàn)’的說法便已興起。不難發(fā)現(xiàn),在這過去的半年內(nèi),大模型領(lǐng)域的發(fā)展非常火熱。但是我有一個問題要問一下在座的各位,這樣的繁榮能夠持續(xù)多久?”

        在發(fā)言開頭,拓爾思副總裁尹世杰便拋出了這樣一個問題。

        21世紀(jì)經(jīng)濟(jì)報道記者發(fā)現(xiàn),在本次論壇中,與會嘉賓除了對國內(nèi)大模型發(fā)展未來的作出展望,也分享了大模型在研發(fā)、升級過程中可能遇到的難點(diǎn)與迷思。

        陳海青提到,雖然Decoder-only是多個主流大模型所采用的架構(gòu),但在進(jìn)行訓(xùn)練的過程中,是對大量的未標(biāo)注文本數(shù)據(jù)進(jìn)行無監(jiān)督預(yù)訓(xùn)練,因此較難找到高質(zhì)量的數(shù)據(jù),包括代碼、人類的指令和反饋等等。

        簡言之,這類架構(gòu)存在穩(wěn)定性能的“先天不足”。因此,在ChatGPT正式發(fā)布之前,業(yè)內(nèi)更偏向走Eecoder-Decoder路線。

        此外,若定制大模型在專業(yè)領(lǐng)域中沒有足夠的切入度,也會失去實際應(yīng)用的意義。尹世杰指出,若要做某個專業(yè)領(lǐng)域的大模型,就必須有專業(yè)領(lǐng)域的高手(參與研發(fā))。以傳媒、金融、安全領(lǐng)域的大模型為例,如果僅是套用泛化的、通用的功能,很有可能難以回答以上行業(yè)實際操作中遇到的專業(yè)問題。

        除了訓(xùn)練因素,目前留給企業(yè)研發(fā)大模型的紅利期和窗口期并不長,則是大模型發(fā)展面臨的一大外部難點(diǎn)。黃赟賀便在發(fā)言中提到,目前B端客戶(企業(yè))最關(guān)心的點(diǎn)在于,在委托相關(guān)公司開發(fā)大模型后,需要多久才能夠真正投入使用。“作為服務(wù)提供方,我們目前一般將大模型的交付周期控制在3個月,以求在短時間內(nèi)進(jìn)行交付,讓企業(yè)快速體驗和使用大模型。”

        尹世杰也指出,無論是做toB或toC的大模型業(yè)務(wù),能不能有實際的場景落地,以及落地以后能否給用戶帶來真實的價值,才是大模型發(fā)展過程中最關(guān)鍵的考驗。

        關(guān)鍵詞:

        標(biāo)簽閱讀


        亚洲免费综合色在线视频| 亚洲综合婷婷久久| 亚洲经典在线中文字幕| 国产美女亚洲精品久久久综合| 全亚洲最新黄色特级网站| 久久久久亚洲精品无码网址色欲| 亚洲熟妇无码八V在线播放| 亚洲av无码一区二区三区天堂古代| 亚洲欧洲日韩国产| 亚洲国产综合第一精品小说| 亚洲福利视频网站| 亚洲AV色吊丝无码| 在线观看日本亚洲一区| 亚洲精品无码专区在线| WWW亚洲色大成网络.COM| 国产精品亚洲天堂| 亚洲国产精品一区二区第一页免| 亚洲精品国产电影| 亚洲欧洲日本在线| 亚洲精品乱码久久久久久自慰| 精品亚洲永久免费精品| 亚洲大片在线观看| 亚洲毛片一级带毛片基地| 亚洲人成综合在线播放| 亚洲一区二区三区播放在线| 亚洲依依成人亚洲社区| 亚洲a∨无码精品色午夜| 亚洲国产主播精品极品网红| 亚洲人成网站在线观看青青| 亚洲线精品一区二区三区| 亚洲AV无码精品无码麻豆| 亚洲视频小说图片| 美女视频黄免费亚洲| 国产精品亚洲专区无码WEB| 亚洲日韩在线第一页| 亚洲AV综合色区无码一区| 亚洲美女自拍视频| 亚洲综合欧美色五月俺也去| 日韩亚洲国产综合久久久| 亚洲熟妇av一区二区三区漫画| 亚洲人成电影福利在线播放 |