www.日日操_国产 日韩 欧美在线_欧美婷婷精品激情_欧美一级视频免费看_伊人久久在线观看_黄色网址在线免费看_www亚洲成人_日本高清视频免费在线观看_51xx午夜影福利_中文字幕网av_日本在线视频www色_jizz欧美性11

登錄
首頁 > 今日新聞 > Vision-Zero:零數據VLM自我進化!陳怡然團隊提出零監督訓練

Vision-Zero:零數據VLM自我進化!陳怡然團隊提出零監督訓練

發布時間:2025-10-12 09:42:32

盡管目前VLM在多模態任務上表現突出,但訓練過度依賴人工標注的數據與精心設計的強化學習獎勵。這種依賴帶來數據稀缺問題:多模態標注成本高昂,限制了訓練數據的規模與多樣性。同時存在知識天花板:模型能力受人類監督邊界限制,難以突破人類已有知識和策略。曾經AlphaGo所使用的自博弈技術通過模型與自身副本競爭交互并自動獲取反饋,把計算轉變為數據的同時消除了對人工監督的依賴,這使得它能夠持續推動模型進步并突破人類能力上限。但是受制于VLM的多模態特性,目前鮮有對自博弈在VLM上應用的系統性研究。為此研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero,此框架有如下特點:

(1)策略自博弈框架:Vision-Zero在以社交推理類游戲為模板的環境中訓練VLM,使得agent在自博弈過程中自動生成高復雜度推理數據,而無需人工標注。

(2)任意形式的圖片都可作為輸入:和以往有限制條件的游戲化訓練框架不同的是,Vision-Zero可在任意形式的圖片上啟動游戲,這使得模型可以在很多不同的領域里獲得相應的能力提升,并有很好的泛化性能。

(3)持續的性能提升:研究團隊提出了自博弈和可驗證獎勵的強化學習(RLVR)交替優化的自博弈策略優化算法(Iterative-SPO),這一算法解決了傳統自博弈算法中常見的性能瓶頸問題。

盡管沒有用任何標注數據做訓練,Vision-Zero在多個領域如推理,圖表問答和Vision-Centric理解任務上超越了其他有標注的SOTA后訓練方法。



從棋盤到現實:

AlphaGo自博弈思想的泛化

自博弈作為OpenAI早期的重要技術路線之一,也是人工智能發展歷程中多項里程碑事件的關鍵推動力。典型代表包括2016年AlphaGo戰勝李世石,以及2019年OpenAI Five在Dota 2上擊敗世界冠軍OG戰隊。人們在看到自博弈在某些特定領域大幅超越人類智能的同時,往往也會思考我們是否有可能把這種思想應用到更多的開放場景中。然而讓AlphaGo從棋盤走入現實需要解決以下幾個難題:

(1)Agent為贏得博弈所習得的技能,應當與目標任務所需的技能高度一致。

(2)博弈環境應當足夠多樣且復雜,以便廣泛的目標任務都能夠滿足條件(1)。

(3)技能增長應當具有可擴展性:隨著自博弈的進行,環境應當不斷提高難度,使得越來越強的智能體能夠涌現,而不是讓訓練收斂到一個固定的上限。

受到社交推理游戲,如“誰是臥底”的啟發,研究團隊設計了一套完備的自博弈規則以解決上述難題,具體規則如下:

(1)游戲中有n名平民和1名臥底。玩家首先被告知自己的角色。

(2)每名玩家會得到一張圖片,臥底的圖片與平民略有不同(如缺失、添加或修改了某個物體)。

(3)線索階段:每位玩家觀察自己的圖片,并給出一個口頭線索,描述圖片內容(可以是物體描述、推斷信息等)。

(4)決策階段:多輪線索給出后,進入決策階段。玩家根據線索結合自己的圖片,投票找出臥底。



此游戲具有高度策略性與挑戰性,臥底需要根據他人線索推斷并偽裝自己,避免暴露。平民需要提供足夠準確但不泄密的線索,同時分析他人線索尋找可疑點。如此一來,Agent在游戲過程中便可生成足夠長且復雜的推理鏈條,并且隨著對手能力的提升,其所面臨的挑戰也會越來越大,并被激發出更強的視覺理解與推理能力。

Copyright 2014-2025 觀經濟 版權所有  京ICP備20151973號-1
www.日日操_国产 日韩 欧美在线_欧美婷婷精品激情_欧美一级视频免费看_伊人久久在线观看_黄色网址在线免费看_www亚洲成人_日本高清视频免费在线观看_51xx午夜影福利_中文字幕网av_日本在线视频www色_jizz欧美性11
热久久久久久| 国产亚洲在线| 在线精品观看| 亚洲一区欧美| 青青青国产精品| 国产午夜一区| 国产一区二区三区91| 日韩精品视频网| 久久激情五月激情| 国产精品久久久网站| 国产精品乱战久久久| 久久不卡国产精品一区二区| 国产精品极品国产中出| 久久精品国产久精国产爱| 国产一区2区在线观看| 丁香六月综合| 狠狠爱成人网| 日韩国产一二三区| 美腿丝袜亚洲三区| av资源亚洲| 亚洲在线电影| 国产精品第一国产精品| 卡一精品卡二卡三网站乱码| 热三久草你在线| 国产亚洲欧洲| 久久影视三级福利片| 日韩另类视频| 亚洲欧洲国产精品一区| 高清日韩欧美| 欧美日韩国产精品一区二区亚洲| 在线精品福利| 日韩理论视频| 日本亚州欧洲精品不卡| 美腿丝袜亚洲一区| 亚洲精品电影| 卡一精品卡二卡三网站乱码| 亚洲精品va| 国产乱论精品| 亚洲不卡系列| 国产精品嫩模av在线| 婷婷成人在线| 欧美国产中文高清| 夜夜精品视频| 你懂的网址国产 欧美| 黄色国产精品| 国产成人精品亚洲线观看 | 国产精品一区二区美女视频免费看| 激情中国色综合| 日韩中文欧美在线| 中文字幕在线视频久| 免费不卡在线观看| 视频二区不卡| 免费在线日韩av| 亚洲精选久久| 一本大道色婷婷在线| 国产精品一卡| 亚洲久久视频| 久久精品亚洲人成影院| 国产一卡不卡| 亚洲欧美日本国产专区一区| 91亚洲国产成人久久精品| 中文字幕亚洲在线观看| 亚洲午夜久久久久久尤物| 国产一区二区三区四区大秀| 视频一区国产视频| 999国产精品视频| 精品国产精品国产偷麻豆| 亚洲人成精品久久久| 日韩午夜av在线| 日韩成人亚洲| 97精品视频在线看| 精品国产亚洲一区二区在线观看| 日韩精品乱码av一区二区| 日韩亚洲精品在线| 欧美日韩精品一区二区视频| 九九99久久精品在免费线bt| 欧美三级第一页| 日韩在线成人| 日产欧产美韩系列久久99| 日韩视频在线一区二区三区 | 蜜臀久久99精品久久一区二区| 久久久久伊人| 日韩av三区| 日韩精品视频在线看| 亚洲字幕久久| 亚洲天堂日韩在线| 久久性天堂网| 亚洲区欧美区| 青青草伊人久久| 国产精品任我爽爆在线播放| 欧美日韩va| 国产欧美一区二区三区米奇| 午夜亚洲福利| 日韩av中文字幕一区二区三区| 日韩一二三区在线观看| 亚洲精品影院在线观看| 日本在线不卡视频| 欧美综合精品| 欧美国产日韩电影| 不卡一二三区| 蜜桃tv一区二区三区| 日韩午夜免费| 日本不卡中文字幕| 久久精品国产久精国产爱| 欧美国产美女| 亚洲成人一区| 日本国产亚洲| 激情久久99| 免费高潮视频95在线观看网站| 日韩欧美精品| 好吊视频一区二区三区四区| 三级在线观看一区二区 | 欧美日韩免费观看一区=区三区| 精品一区在线| 日本亚洲不卡| 电影91久久久| 91久久午夜| 国产极品久久久久久久久波多结野 | 最新国产拍偷乱拍精品| 国产偷自视频区视频一区二区| 蜜桃久久久久久| 麻豆视频观看网址久久| 欧美二三四区| 99亚洲视频| 另类综合日韩欧美亚洲| 久久精品国语| 日韩av网站在线观看| 欧美久久天堂| 亚洲精品一二| 色爱综合av| 青青伊人久久| 不卡中文一二三区| 欧美偷窥清纯综合图区| 日韩精品免费一区二区在线观看| 蜜臀av国产精品久久久久| 久久超碰99| 美女少妇全过程你懂的久久| 日韩高清不卡一区二区| 麻豆mv在线观看| 中文不卡在线| 久久久精品久久久久久96 | 日韩区一区二| 欧美日韩在线二区| 国产精品1区在线| 好吊一区二区三区| 亚洲欧洲美洲av| 日韩av中文字幕一区二区| 欧美日韩一区二区三区视频播放| 青青草国产精品亚洲专区无| 不卡一区2区| 电影91久久久| 日韩国产欧美视频| 日韩视频中文| 久久中文亚洲字幕| 激情国产在线| 精品国产美女a久久9999| 日韩精品一区二区三区中文| 美女毛片一区二区三区四区 | 老司机久久99久久精品播放免费| 中文字幕在线官网| 国产精品久久久网站| 蜜桃久久久久久| 亚洲一区中文| 亚洲一区二区三区四区五区午夜| 日韩精品dvd| 久久精品国产99国产| 日本欧美一区二区在线观看| 最新日韩欧美| 午夜欧美精品| 亚洲精品电影| 免费毛片在线不卡| 日韩成人亚洲| 日韩在线不卡| 亚洲最新无码中文字幕久久| 久久尤物视频| 国产成人精品一区二区三区免费 | 视频国产精品| 日韩精品一卡二卡三卡四卡无卡| 免费不卡中文字幕在线| 久久久久蜜桃| 欧美日韩在线网站| 99精品在线观看| 亚洲女同中文字幕| 欧美精品一二| 国产亚洲精品久久久久婷婷瑜伽| 欧美日韩高清| 六月天综合网| 日韩国产欧美视频| 国产精品亚洲欧美一级在线| 青青伊人久久| 麻豆成人91精品二区三区| 久久麻豆视频| caoporn视频在线| 日韩av一级| 午夜av一区| 亚洲日产av中文字幕| 欧美亚洲一级| 成人精品国产亚洲| 欧美 日韩 国产一区二区在线视频 | 久久亚洲精精品中文字幕|