日本成人激情_久久久免费精品视频_亚洲激情四射视频中文字幕久久_日本wwwwww_男女做爰裸体猛烈吃奶摸视频_日韩大片在线观看

AI發(fā)展:訓練數(shù)據(jù)即將遭遇瓶頸

2024-12-31 01:01:00 來源: 點擊數(shù):

科技日報記者 張佳欣

得益于神經(jīng)網(wǎng)絡規(guī)模的擴大以及海量數(shù)據(jù)的訓練,人工智能(AI)在過去10年間突飛猛進。“做大做強”的策略,在構(gòu)建大型語言模型(LLM)上取得了顯著成果,ChatGPT就是一個典型的例子。

然而,《自然》《麻省理工科技評論》等多家雜志網(wǎng)站指出,AI擴展正逼近極限。一方面,AI“吞噬”著越來越多的能源;另一方面,滋養(yǎng)無數(shù)模型成長的傳統(tǒng)數(shù)據(jù)集,正被LLM開發(fā)人員過度開墾。

訓練數(shù)據(jù)即將遭遇的瓶頸已悄然浮現(xiàn)。有研究機構(gòu)預測,到2028年左右,用于訓練AI模型的數(shù)據(jù)集典型規(guī)模將達到公共在線文本總估計量的規(guī)模。換句話說,AI可能會在大約4年內(nèi)耗盡訓練數(shù)據(jù)。與此同時,數(shù)據(jù)所有者(如報紙出版商)開始打擊對其內(nèi)容的濫用行為,進一步收緊了訪問權(quán)限,這正在引發(fā)“數(shù)據(jù)共享”規(guī)模上的危機。為此,開發(fā)人員必須尋找變通之道。

數(shù)據(jù)集供需失衡

過去10年間,LLM的發(fā)展顯示出了對數(shù)據(jù)的巨大需求。自2020年以來,用于訓練LLM的“標記”(或單詞)數(shù)量已增長100倍,從數(shù)百億增加到數(shù)萬億。一個常見的數(shù)據(jù)集RedPajama,包含數(shù)萬億個單詞。這些數(shù)據(jù)會被一些公司或研究人員抓取和清洗,成為訓練LLM的定制數(shù)據(jù)集。

然而,可用互聯(lián)網(wǎng)內(nèi)容的增長速度出乎意料的緩慢。據(jù)估計,其年增長率不到10%,而AI訓練數(shù)據(jù)集的大小每年增長超過一倍。預測顯示,這兩條曲線將在2028年左右交匯。

與此同時,內(nèi)容供應商越來越多地加入軟件代碼或修改條款,阻止爬蟲及AI抓取其數(shù)據(jù)。在這些內(nèi)容中,被明確標記為限制爬蟲訪問的數(shù)量,從2023年的不足3%猛增到了2024年的20%至33%之間。

當前,圍繞AI訓練中數(shù)據(jù)使用的合法性,試圖為數(shù)據(jù)提供商爭取應有賠償?shù)亩嗥鹪V訟正在進行。2023年12月,《紐約時報》向OpenAI及其合作伙伴微軟提起了訴訟,指控其侵犯了版權(quán);今年4月,紐約市Alden全球資本旗下的8家報紙聯(lián)合發(fā)起了一起類似的訴訟。對此,OpenAI表示,《紐約時報》的訴訟“毫無根據(jù)”。

若法院最終站在內(nèi)容提供商一方,支持其獲得經(jīng)濟賠償,那么對于AI開發(fā)人員,尤其是那些資金緊張的學者而言,獲取所需數(shù)據(jù)無疑將變得更加艱難。

新方法有待印證

數(shù)據(jù)匱乏對AI的傳統(tǒng)擴展策略構(gòu)成了潛在挑戰(zhàn)。

尋找更多數(shù)據(jù)的一個途徑是收集非公開數(shù)據(jù),如社交媒體消息或視頻文字記錄。然而,這種做法的合法性尚存爭議。

一些公司選擇使用自己的數(shù)據(jù)來訓練AI模型,如Meta利用虛擬現(xiàn)實頭顯收集的音頻和圖像進行訓練。但各公司政策不同,包括Zoom在內(nèi)的一些公司則明確表示不會使用客戶內(nèi)容訓練AI。

另一種選擇可能是專注于快速增長的專業(yè)數(shù)據(jù)集,如天文學或基因組學數(shù)據(jù),但其對訓練LLM的可用性和實用性尚不清楚。

如果AI接受除文本之外的多種類型的數(shù)據(jù)訓練,可能會為豐富數(shù)據(jù)的涌入打開閘門。Meta首席AI科學家勒丘恩強調(diào),人類通過觀察物體而“吸收”的數(shù)據(jù)遠超用于訓練LLM的數(shù)據(jù)量,機器人形態(tài)的AI系統(tǒng)或許能從中獲取經(jīng)驗。

此外,制造數(shù)據(jù)也是解決之道。一些AI公司付費讓人們生成訓練內(nèi)容,或使用AI生成的合成數(shù)據(jù)來訓練AI。這已成為一個潛在的巨大數(shù)據(jù)源。然而,合成數(shù)據(jù)也存在問題,如遞歸循環(huán)可能鞏固錯誤、放大誤解,并降低學習質(zhì)量。

小模型更專更精

另一種策略是摒棄模型“越大越好”的開發(fā)觀念。一些開發(fā)者已在追求更高效、專注于單一任務的小型語言模型。這些模型需要更精細、更專業(yè)的數(shù)據(jù)以及更好的訓練技術。

12月5日,OpenAI發(fā)布了新的OpenAI o1模型。盡管該公司未透露模型的規(guī)模或訓練數(shù)據(jù)集大小,但o1采用了新方法:在強化學習上投入更多時間,讓模型對每個回答進行更深入的思考。這標志著一種轉(zhuǎn)變,即從依賴大規(guī)模數(shù)據(jù)集進行預訓練,轉(zhuǎn)向更注重訓練和推理。

當前,LLM可能已飽覽互聯(lián)網(wǎng)大部分內(nèi)容,或許無需更多數(shù)據(jù)即可變得更智能。美國斯坦福大學一項研究表明,模型從多次讀取給定數(shù)據(jù)集中學到的內(nèi)容,與從相同數(shù)量的唯一數(shù)據(jù)中學習到的內(nèi)容一樣豐富。

合成數(shù)據(jù)、專門數(shù)據(jù)集、多次讀取和自我反思等因素的結(jié)合,或?qū)⒐餐苿覣I的進一步飛躍。

責任編輯:左常睿

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽
主站蜘蛛池模板: av不卡国产_蜜桃成人免费视频在线播放_特级黄色毛片在放_人人超碰免费_国产精品男人的天堂_国产在线精品一区二区三区》_日本一级中文字幕久久久久久_我朋友的妈妈在线 | 亚洲久久视频_欧美国产日本_国产成人无码精品久久久免费_久久精品视频网站_边做边流奶水的人妻_国内网站成视频在线观看_色网免费观看_67194熟妇在线直接进入 | 日韩精品国产一区_久久久精品毛片_91视频九色网站_麻豆视频免费看了_国产在视频线在精品视频2020_国产免费一_在线免费视频_日本三级在线播放线播放 又黄又爽的成人免费视频_caopeng在线_国产精品自在线_亚洲精品美女久久久久久久久久_久久久久久国产精品免费_中国wwwxxxx_精品国产天堂_成年女人午夜毛片免费视频 | 久久只有这里有精品_亚洲一区二区三区在线观看成人av_久久精品久久久久久噜噜老黄_午夜一区在线观看_久久久免费的成人性教育片_天天爱天天做天天爽夜夜揉_国产精久久一区二区三区_中国老熟女人hd | 国产精品自在拍视频首页_中文字幕乱码亚洲无线码按摩_成人激情视频在线观看_www.四虎com_国产在线视频99_2002亚洲精品真实在线_国产精选在线播放_色先锋影音岛国av资源 | 人人妻人人澡人人爽欧美一在内谢_亚洲成aⅴ人片久青草影院_亚洲AV无码一区东京热蜜芽_性刺激久久久久久久久九色_一級特黃色毛片免費看_免费看无码特级毛片_日本成人免费在线_国产福利日本一区二区三区 | 欧美日韩在线视频播放_成人国产1314www色视频_粗大猛烈进出白浆视频_懂色av一区二区三区免费观看_亚洲看片_免费人成自慰网站_天堂网在线观看视频_亚洲激情视频在线观看 | 伊人久久精品一区二区三区_男人的午夜影院_aaaa视频_青青伊人影院_国产91精品入口_97影院理论片手机在线观看_国产97色在线_久久最新最热 | 精品一区二区三区91_国产黄网在线_国产精品熟妇一区二区三区四区_亚洲αv在线精品糸列_无遮挡边摸边吃奶边做的视频刺激_在线免费观看h视频_狠狠爱网_免费无码AV片在线观看软件 | 亚洲a片无码精品毛片色戒_亚洲欧美日韩综合久久久久_av免费观看网址_黄色av影院在线观看_欧美偷拍另类_一级成人在线_xxxxx18国产_bestialityvideo另类骆驼 | h无码精品动漫在线观看_超级色观看在线_国内揄拍国内精品浪潮av_美女的烦恼视频播放网站_日韩一区二区在线看_精品国产粉嫩内射白浆内射双马尾_国产二级av_中文字幕亚洲精品久久AV | 欧美日韩免费一_国产主播一区二区三区在线观看_欧美妇乱大交xxxxx_亚洲国产综合久久_久久一区二区免费视频_久久久国产精品麻豆_日本一区二区三区免费在线观看_www.youjizz.com国产 | 精国产品一区二区三区_国产亚洲欧美日韩亚洲中文色_欧美日韩a区_在线播放成人_成人a区_国产成人亚洲综合一区_A级毛片100部免费观看_日本一级特黄高潮 | 色欲视频综合免费天天_麻豆网站在线看_久久久久久久久久一区二区_91国内视频在线_欧美毛多水多肥妇_无码裸模视频在线观看_国产精品久人妻精品老妇_a级毛片免费 | 精品国产不卡一区二区_91精品国产影音先锋大全_欧美日韩精选_国产第19页精品_成人性生交大片免费看视频hd_第一av网_久久久黑人_欧精品一区 | 少妇高潮太爽了在线视频_波多野结衣无码视频在线观看_欧美精品momssexxxx_美女被强遭的免费网站视频_久久国产精品视频免费看_亚洲精品高清国产一线久久_高清三区_91综合在线视频 | 亚洲最大色大成人av_欧美成人小视频_精品视频一区二区三区中文字幕_九色视频网_亚洲国产成人精_亚洲精品v欧美精品动漫精品_欧洲LV尺码大_一区二区三区在线看 | 国产又黄又粗又爽又色的视频_亚洲视频在线不卡_国产a区b区_夜色99_曰韩精品一区二区_亚洲乱码国产乱码精品精软件_亚洲国产日韩一区二区三区_在线观看美女黄视频 | 香蕉久久一区二区不卡无毒影院_成全免费高清观看_看片免费黄在线观看入口_亚洲日本aⅴ片在线观看香蕉_国产精品嫩草影院88av_一级片免费无码_超碰97av在线_大香焦久久 | 成人黄色小说视频_国产CHINESEHDXXXX美女_欧美日一区二区_麻豆短视频免费_国产精品x453.com_国产乱子伦在线观看免费_少妇激烈床戏视频_一区二区欧美在线观看 | 新91在线观看_久久中文字幕亚洲精品最新_AⅤ无码国产在线看_久青草国产在视频在线观看_免费h片在线观看_国产精品美女视频免费午夜版_猫咪成人官网_成人免费午夜视频69影院 | 日产精品一线二线三线区_欧洲成人在线_欧洲美熟女乱AV亚洲一区_在线看片黄色_欧美兽交一区二区三区影院_伊人久久大香线蕉AV不变影院_男人日女人的网站_日韩av在线综合 | 91女神在线观看_国产精品激情久久久久久久_精品国产欧美_日日干夜夜操高清视频_成人avav_日韩经典一区二区_成人在线观看一区二区_日产一级片 | 私人影院免费看_日韩三级一区二区三区_欧美国产日韩在线观看成人_人人妻一区二区三区_18禁超污无遮挡无码免费网站国产_欧美xxxx做受欧美_国产精品一二三区免费_www天天干 | 日韩第一视频_香蕉影院在线_无套内射无矿码免费看黄_千金不装了短剧免费观看_九九久久国产_爆乳2把你榨干哦无码_三级小说一区_国产在线观看91一区二区三区 | 大屁股熟女ASS_av不卡免费_人人爽人人爽人人片AV_天天搞夜夜操_亚洲а∨天堂手机版在线观看_亚洲一区二区三区在线极品_国产女人网_狼干综合 | 欧美精品一区二区三区精品_午夜福利无遮挡十八禁视频_久草视频首页_婷婷香蕉久久狠狠涩涩俺也去_日韩少妇视频_亚洲精品二_国产区2_亚洲人成在久久综合网站 | 俺也来俺也去俺也射_午夜精品久久久久久久久_国产高清一级毛片_日本线视频www_少妇粉嫩小泬白浆流出_99久久精品毛片免费_亚洲AV无码专区日韩乱码不卡_久久夜夜躁天天躁背后的原因 | 先锋影音在线资源站91_国产免费一级淫片_四虎黄色网址_久草热8精品视频在线观看_大学生一级片_国产在线a_欧美特黄特色视频_精品成人乱色一区二区 | 中文无码乱人伦中文视频在线_国产福利无码一区在线_程视频精品视频一区二区三区欧_国产精品二区视频_一区二区三区高清视频在线观看_国产成人在线免费_国产乱码一区二区三区爽爽爽_日韩欧美色激情 | 久久久久在线视频_狠狠综合久久av一区二区小说_又摸又揉又黄又爽的视频_国产欧美日产激情视频_欧美在线一级va免费观看_一级黄色片aaa_女人精25xxxxx免费视频_精品国产大片久久久久久久久 国产视频精品区_在线观看一级黄色片_国内自产少妇自拍区免费_九九精品网_精品视频一区在线观看_久久精品A片777777_国产精品网站一区二区三区_日本老妇xxxx | 人人妻人人澡人人爽欧美一在内谢_亚洲成aⅴ人片久青草影院_亚洲AV无码一区东京热蜜芽_性刺激久久久久久久久九色_一級特黃色毛片免費看_免费看无码特级毛片_日本成人免费在线_国产福利日本一区二区三区 | 色欲视频综合免费天天_麻豆网站在线看_久久久久久久久久一区二区_91国内视频在线_欧美毛多水多肥妇_无码裸模视频在线观看_国产精品久人妻精品老妇_a级毛片免费 | 激情久久中文字幕_亚洲经典国产欧美_草草久久久_91看片儿_蜜臀免费av_美女一区视频_97在线视频免费看_内插射精大群交在线 | 两根一起进三P免费视频_色偷偷偷久久伊人大杳蕉_狠操在线_91成人在线精品视频_在线成人毛片_一级特黄bbbbb免费观看_91怡红院_免费人成网站视频在线观看国内 | 色偷偷亚洲第一综合网_在线观看的片www免费观看_爆乳一丝丝不挂裸体大胸美女_相泽南亚洲一区二区在线播放_美女裸体无遮挡永久免费视频网站_日韩av激情在线观看_99re超碰_中文天堂在线资源www | 欧美性战a久久久久久_欧美性爱一区三区_大地免费资源观看_精品1区2区3区4区_国产在线榴莲视频导航_97久久精品人人槡人妻人人玩_一级红色毛片_国产AV无码专区亚洲版 | 成人一在线视频日韩国产_超碰在线公开97_久久亚洲精品国产一区_国产精品久久不能_午夜亚洲精品专区高潮日w_kaori肉感在线播放_www.四虎影视.com_欧美日韩久 | 久久国产播_www.狠狠撸.com_国内精品少妇在线播放_打屁股狠网站spαnkvieos_国产农村乱辈无码_国产亚洲精久久久久久蜜臀_2020年国产精品_一区二区三区产品乱码的解决方法 | 亚洲中文无码卡通动漫3D_欧美精品久久凉森玲梦_国产美女mm131爽爽爽_www久久久久久久_欧美506070老妇乱子伦_亚洲精品在线视频网站_国产导航在线_懂色av中文一区二区三区 | 亚洲人成色4444在线观看_美女视频黄又黄又免费高清_西游性淫片a级在线观看_欧美成a人片在线观看久_特级黄色毛片视频片子_青草久久久国产线免观_国产精品999在线观看_色欧美色美色一区二区在线 |