日本在线www-日本在线播放一区-日本在线不卡免费视频一区-日本在线不卡视频-成人影院久久久久久影院-成人影院一区二区三区

ABB
關(guān)注中國自動化產(chǎn)業(yè)發(fā)展的先行者!
CAIAC 2025
2025工業(yè)安全大會
OICT公益講堂
當(dāng)前位置:首頁 >> 資訊 >> 行業(yè)資訊

資訊頻道

MM-RLHF:多模態(tài)大語言模型對齊新范式
  • 點(diǎn)擊數(shù):961     發(fā)布時間:2025-02-28 13:45:52
  • 分享到:
當(dāng)前,多模態(tài)大語言模型(MLLMs)在處理涉及視覺、語言和音頻的復(fù)雜任務(wù)中取得了顯著進(jìn)展,但現(xiàn)有的先進(jìn)模型仍然缺乏與人類意圖偏好的充分對齊,即無法高質(zhì)量地按照人類偏好習(xí)慣理解并完成指令任務(wù)。現(xiàn)有的對齊研究多集中于某些特定領(lǐng)域(例如減少幻覺問題),而是否通過與人類偏好對齊可以全面提升多模態(tài)大語言模型的各種能力仍是一個未知數(shù)。
關(guān)鍵詞:

當(dāng)前,多模態(tài)大語言模型(MLLMs)在處理涉及視覺、語言和音頻的復(fù)雜任務(wù)中取得了顯著進(jìn)展,但現(xiàn)有的先進(jìn)模型仍然缺乏與人類意圖偏好的充分對齊,即無法高質(zhì)量地按照人類偏好習(xí)慣理解并完成指令任務(wù)。現(xiàn)有的對齊研究多集中于某些特定領(lǐng)域(例如減少幻覺問題),而是否通過與人類偏好對齊可以全面提升多模態(tài)大語言模型的各種能力仍是一個未知數(shù)。

為探究這一問題,中國科學(xué)院自動化研究所聯(lián)合快手、南京大學(xué)建立了MM-RLHF——一個包含12萬對精細(xì)標(biāo)注的人類偏好比較數(shù)據(jù)集,并基于此數(shù)據(jù)集進(jìn)行多項創(chuàng)新,從數(shù)據(jù)集,獎勵模型以及訓(xùn)練算法三個層面入手推動多模態(tài)大語言模型對齊的發(fā)展,全面提升多模態(tài)大語言模型在視覺感知、推理、對話和可信度等多個維度的能力。

MM-RLHF數(shù)據(jù)集包含三個維度的打分、排序、文本描述的具體原因以及平局等標(biāo)注。所有標(biāo)注均由人類專家完成。與現(xiàn)有資源相比,該數(shù)據(jù)集在規(guī)模、多樣性、標(biāo)注精細(xì)度和質(zhì)量方面均有顯著提升。以此為基礎(chǔ),本研究提出了一種基于批判的獎勵模型(Critique-Based Reward Model),該模型在評分之前先對模型輸出進(jìn)行批判分析,相比傳統(tǒng)的標(biāo)量獎勵機(jī)制,提供了更具可解釋性、信息量更豐富的反饋。此外,團(tuán)隊提出動態(tài)獎勵縮放(Dynamic Reward Scaling)方法,根據(jù)獎勵信號調(diào)整每個樣本的損失權(quán)重,從而優(yōu)化高質(zhì)量比較數(shù)據(jù)在訓(xùn)練中的使用,進(jìn)一步提高了數(shù)據(jù)的使用效率。

MM-RLHF數(shù)據(jù)集

研究團(tuán)隊在10個評估維度,27個基準(zhǔn)測試上對提出的方案進(jìn)行了嚴(yán)格評估。結(jié)果表明,模型性能得到了顯著且持續(xù)的提升。比較突出的是,基于提出的數(shù)據(jù)集和對齊算法對LLaVA-ov-7B模型進(jìn)行微調(diào)后,其對話能力平均提升19.5%,安全性平均提升60%。

全面評估結(jié)果

本研究充分展示了高質(zhì)量、細(xì)粒度數(shù)據(jù)集MM-RLHF在推動多模態(tài)大語言模型對齊工作上的巨大潛力。下一步,研究團(tuán)隊將將重點(diǎn)利用數(shù)據(jù)集豐富的注釋粒度與先進(jìn)的優(yōu)化技術(shù),結(jié)合高分辨率數(shù)據(jù)來解決特定基準(zhǔn)的局限性,并使用半自動化策略高效地擴(kuò)展數(shù)據(jù)集。這些努力不僅將推動多模態(tài)大語言模型對齊到新的高度,還將為更廣泛、更具普適性的多模態(tài)學(xué)習(xí)框架奠定基礎(chǔ)。

MM-RLHF數(shù)據(jù)集、訓(xùn)練算法、模型以及評估pipeline均已全面開源。

項目主頁:https://mm-rlhf.github.io


來源:中國科學(xué)院自動化研究所


熱點(diǎn)新聞

推薦產(chǎn)品

x
  • 在線反饋
1.我有以下需求:



2.詳細(xì)的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 毛片黄色视频-毛片黄色片-毛片黄-毛片国产-亚洲剧场午夜在线观看-亚洲久操 | 成人久久久久-成人久久久-成人久久精品一区二区三区-成人久久18免费游戏网站-成人久久18免费网-成人久久18免费软件 | 久久久久久一级毛片免费野外-久久久久久一级毛片免费无遮挡-久久久久久亚洲精品影院-久久久久久亚洲精品不卡-午夜久久精品-午夜精品在线视频 | 亚洲精品成人一区-亚洲精品成人网久久久久久-亚洲精品成人久久久影院-亚洲精品成人久久-黑人巨大白妞出浆-黑人巨大vs小早川怜子 欧美日韩亚洲无线码在线观看,国产成人亚洲综合91精品555,欧美成人国产,国产成人青青热久免费精品,亚洲欧美日韩色图,国产三级网站在线观看 | 国产夜色福利院在线观看免费-国产夜趣福利免费视频-国产野花视频天堂视频免费-国产亚洲综合一区二区在线-日韩精品在线观看免费-日韩精品在线电影 | 亚洲日本中文字幕在线-亚洲日本中文字幕区-亚洲日本中文字幕-亚洲日本中文-免费jizz在在线播放国产-免费jizz在线播放视频 | 亚洲第一视频网,久久91精品国产99久久yfo,国产精品一区二区三区免费,成人欧美一区二区三区黑人,在线观看国产精品入口,亚洲人一区 | 久久99热不卡精品免费观看,色播综合,国产一级视频在线观看网站,激情综合激情,aa视频在线观看,五月天综合激情网 | 2015天堂网-2014天堂网-19国产精品麻豆免费观看-18视频在线观看网站-18黄免app网站-18成网站www在线观看 | 天天干在线免费视频-天天干夜夜爱-天天干网-天天干天天曰天天操-天天干天天夜-天天干天天玩天天操 | 精品国产91乱码一区二区三区,成人国产一区二区三区精品,亚洲一区免费在线观看,日韩在线一区二区三区免费视频,波多野吉衣在线观看,日韩一级精品久久久久 | 我爱52av好色,一级毛片大全免费播放,成人午夜无人区一区二区,国产一区国产二区国产三区,青青青青久久精品国产h,狠狠操五月天 | 精品久久久久久蜜臂a∨-精品久久久久久蜜臀-精品久久久久久免费看-精品久久久久久免费影院-精品久久久久久清纯-精品久久久久久日韩字幕无 | 久久综合影视-久久综合伊人77777麻豆-久久综合一区二区三区-久久综合一-亚欧三级-亚欧美综合 | 久久道-久久大香伊蕉在人线国产昨爱-久久大香香蕉国产免费网站-久久大-天天做天天爽天天谢-天天做天天射 | 在线播放波多野结衣-在线播放91撕破艺校舞蹈系-在线播放69热精品视频-在线www天堂资源网-欧美裸色美妆大全-欧美伦理三级 | 日本欧美大码aⅴ在线播放-日本欧美不卡一区二区三区在线-日本女同在线观看-日本女同在线-国产日韩在线-国产日韩视频一区 | 天天干天天操天天碰-天天干天天操天天摸-天天干天天操天天干-天天干天天操天天插-欧美一级久久久久久久久大-欧美一区二区VA毛片视频 | 日韩专区第一页-日韩中文字幕在线亚洲一区-日韩中文字幕在线观看视频-日韩中文字幕在线播放-日韩中文字幕一区二区不卡-日韩中文字幕一区 | 在线亚洲不卡,三上悠亚一区二区观看,91伊人久久,婷婷激情五月,中文字幕久久精品,色综合久久中文字幕 | 99久久免费视频-99久久免费看精品国产一区-99久久免费看国产精品-99久久免费精品视频-欧美ⅹxxxx视频-欧美ⅹxxxhd3d | 黄色在线免费播放-黄色在线免费-黄色在线看网站-黄色在线观看网站-色综合小说天天综合网-色综合小说久久综合图片 | 国产一级一级一级成人毛片-国产一级一级片-国产一级网站-国产一级特黄在线播放-午夜影院一区二区三区-午夜影院小视频 | 性情网站-性派对交换俱乐部-性派对xxxhd-性派对videos18狂欢-国产中学生-国产中文字幕在线视频 | 久久99精品久久久久久噜噜噜-久久99精品久久久久久噜噜丰满-久久99精品久久久久久噜噜-久久99精品久久久久久久野外-午夜精品人妻无码一区二区三区-午夜精品免费 欧美日韩在线成人免费-欧美日韩在线成人看片a-欧美日韩在线不卡-欧美日韩在线播放-自拍偷拍三级-自拍偷拍欧美亚洲 | 黄色片网站免费观看-黄色片网站观看-黄色片网站大全-黄色片视频网-色偷偷网址-色偷偷网站 | 福利视频欧美一区二区三区-福利视频欧美-福利视频你懂的-福利视频导航网址-福利视频导航网-福利视频导航大全 | 97色伦人人-97色碰-97视频久久-97视频免费人人观看人人-免费看色片网站-免费看视频的网站 | 国产在线观看 完整版-国产在线高清不卡免费播放-国产在线不卡一区-国产在线不卡视频-亚洲国产精品影院-亚洲国产精品一区二区三区在线观看 | 欧洲亚洲综合,亚洲欧美综合视频,国产视频分类,欧美亚洲综合在线,亚洲另类第一页,91在线观 | 老司机亚洲精品影院-老司机午夜在线视频-老司机午夜影院-老司机午夜网站-亚洲国产精品热久久2022-亚洲国产精品毛片∧v卡在线 | 欧美黑寡妇香蕉视频-欧美国产一区视频在线观看-欧美国产一区二区三区-欧美国产一区二区-国产成人精品第一区二区-国产成人精品2021欧美日韩 | 亚洲成人777777-亚洲成av人在线视-亚洲成av人影片在线观看-亚洲成av人片在线观看-玖玖色资源-玖玖色在线 | 亚洲另类电击调教在线观看-亚洲理论片在线中文字幕-亚洲看黄-亚洲卡一卡2卡三卡4麻豆-韩国xxxxx视频在线-韩国mmwutv福利视频 | 久久久久久久久久久久久久,免费福利资源站在线视频,午夜精品久久久久久影视riav,黄色的视频免费观看,国产人成免费视频,国产福利小视频 | 黄色片网站免费观看-黄色片网站观看-黄色片网站大全-黄色片视频网-色偷偷网址-色偷偷网站 | 欧美在线一,91成人爽a毛片一区二区,在线播放国产精品,亚洲欧美日韩高清,zozozo欧美人禽交另类视频,久久精品无码一区二区日韩av | 国产一级免费-国产一级毛片网站-国产一级毛片潘金莲的奶头-国产一级毛片大陆-日本中文字幕免费-日本中文字幕高清 | a级国产精品片在线观看-a级国产乱理伦片野外-a级国产乱理伦片在线观看a-a级国产乱理片在线观看-a级国产片-a级国产视频 | 久久久久综合网久久-久久久久亚洲精品影视-久久久久久久久66精品片-久久久久久久999-阿v天堂2022在线观看-а中文在线天堂 | 亚洲福利区-亚洲福利精品电影在线观看-亚洲福利电影一区二区?-亚洲风情无码免费视频-国产亚洲视频在线-国产亚洲视频精彩在线播放 |