无码一区二区三区,国产熟妇无码A片AAA毛片视频,人妻无码,无码一区二区,日韩无码电影,中文字幕精品无码亚洲电影

請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗：Google Chrome、Mozilla Firefox、Internet Explorer、Microsoft Edge 或Safari。

為避免使用網(wǎng)頁時發(fā)生問題，請確保你的網(wǎng)頁瀏覽器已更新至最新版本。

熱門搜尋:

首頁
首頁
香港
神州
灣區(qū)人
- - 灣區(qū)企業(yè)
- - 灣區(qū)生活
- - 灣區(qū)文化
- - 灣區(qū)旅遊
- - 灣區(qū)人才
- - 灣區(qū)政策
- - 灣區(qū)服務(wù)易
經(jīng)濟
- - 財經(jīng)
- - 地產(chǎn)
- - 投資
- - 財評
國際
評論
- - 社評
- - 評論
- - 來論
視頻
- - 新聞
- - 訪談
- - 直播
文化
- - 文博
- - 藝術(shù)
- - 文學(xué)
娛樂
生活
- - 旅遊
- - 美食
- - 時尚
- - 健康
教育
體育
科技
專題
- - 香港
- - 兩岸
- - 國際
專欄
圖集
- - 香港
- - 神州
- - 國際
文匯報
地方聯(lián)播

全部

全部
即時
報紙
圖集
視頻

從新到舊

從新到舊
從舊到新
相關(guān)度

搜全文

全文
標(biāo)題
關(guān)鍵字

顯示更多

文匯網(wǎng) 專題香港教育即時新聞

即夢AI綜合質(zhì)素稱冠豆包圖像修改最佳

港大發(fā)布最新AI圖像生成能力測評這些中國模型創(chuàng)最佳成績！

即時新聞

2025-03-06 14:11:00 即時新聞

香港文匯報訊香港大學(xué)經(jīng)管學(xué)院今日發(fā)表《人工智能模型圖像生成能力綜合評測報告》，針對15個「文生圖模型」及7個「多模態(tài)大語言模型」進行全面評估。研究顯示，字節(jié)跳動的即夢AI和豆包，以及百度的文心一言，在新圖像生成的內(nèi)容質(zhì)素及圖像修改的表現(xiàn)突出。

是次評測主要針對新圖像生成及對現(xiàn)有圖像修改兩種任務(wù)的表現(xiàn)。

首先，新圖像生成任務(wù)的評測包含兩方面：生成內(nèi)容質(zhì)素和安全與責(zé)任性。

? 內(nèi)容質(zhì)素 — 透過以下三個維度進行評估：圖文一致性（衡量圖像是否能準(zhǔn)確反映文字指令中的物件、場景或概念）；圖像合理可靠性（衡量圖像內(nèi)容的事實準(zhǔn)確性，確保圖像符合現(xiàn)實世界規(guī)律）；圖像美感（衡量圖像的美學(xué)質(zhì)素，包括構(gòu)圖、色彩協(xié)調(diào)性和創(chuàng)意等因素）。內(nèi)容質(zhì)素由專家評分者在模型一對一比較的情況下進行評價，最終以Elo評分進行科學(xué)排名。

在新圖像生成的內(nèi)容質(zhì)素方面，由字節(jié)跳動推出的即夢AI表現(xiàn)最佳，獲得1,123分，百度的文心一言 V3.2.0、Midjourney v6.1及豆包則緊隨其後。

新圖像生成的內(nèi)容質(zhì)素綜合排名

? 安全與責(zé)任性 — 衡量人工智能模型在生成新圖像時的安全合規(guī)性與社會責(zé)任意識，測試指令涵蓋以下類別：偏見與歧視、違法活動、危險元素、倫理道德、版權(quán)侵犯以及隱私/肖像侵犯。

在新圖像生成的安全與責(zé)任方面， OpenAI的GPT-4o的評分最高，平均得分為6.04，通義千問V2.5.0和 Google的Gemini 1.5 Pro 分別以5.49分及5.23分排名第二及第三。評測結(jié)果亦顯示部分文生圖模型雖然在內(nèi)容質(zhì)素方面表現(xiàn)優(yōu)異，卻在安全與責(zé)任方面的表現(xiàn)未如理想，反映文生圖模型的圖像生成能力不均。在缺乏足夠安全保障和倫理約束的情況下，這些工具可能帶來社會風(fēng)險。

新圖像生成的安全與責(zé)任排名

而圖像修改任務(wù)的評測範(fàn)圍包括風(fēng)格修改和內(nèi)容修改，與新圖像生成的內(nèi)容質(zhì)素評估相類似，圖像修改從三個維度進行評估：圖文一致性、圖像合理可靠性及圖像美感。

在13個支援圖像修改的模型當(dāng)中，豆包、即夢AI和文心一言V3.2.0均表現(xiàn)出色，緊隨其後為 GPT-4o和Gemini 1.5 Pro。

圖像修改綜合排名

隨著生成式人工智能技術(shù)不斷進步，圖像理解與生成這兩大核心領(lǐng)域均取得了突破性成果，為傳統(tǒng)及新興領(lǐng)域注入活力和開拓更多可能性。然而，目前對人工智能圖像生成能力的評估仍處於起步階段，現(xiàn)有人工智能模型圖像生成的評測體系亦未有充分考慮安全與倫理因素，難以全面反映模型表現(xiàn)。

有見及此，繼早前發(fā)布的《人工智能大語言模型評測綜合排行榜》及《人工智能大語言模型圖像理解能力綜合評測報告》，港大經(jīng)管學(xué)院創(chuàng)新及資訊管理學(xué)教授兼夏利萊伉儷基金教授（戰(zhàn)略信息管理學(xué)）蔣鎮(zhèn)輝再次率領(lǐng)人工智能大模型評測團隊，就新圖像生成和圖像修改兩大核心範(fàn)疇，共同構(gòu)建一套更全面的人工智能模型圖像生成能力評測體系，透過更科學(xué)多元的評測方式，幫助用家理解及選擇合適的圖像生成模型，亦為開發(fā)者提供參考以改進設(shè)計。

蔣鎮(zhèn)輝表示：「在當(dāng)前中國科技迅猛發(fā)展的浪潮中，我們在推動技術(shù)突破的同時，必須在創(chuàng)新、提升質(zhì)素與安全責(zé)任之間取得平衡，以推動行業(yè)健康發(fā)展。這套多模態(tài)評測體系將為生成式人工智能技術(shù)發(fā)展奠定重要基礎(chǔ)，助力建立一個安全、負(fù)責(zé)任且可持續(xù)的人工智慧大模型生態(tài)系統(tǒng)?！?/p>

顯示更多

相關(guān)推薦

呼图壁县| 云南省| 怀宁县| 宝鸡市| 新绛县| 五河县| 红原县| 丹凤县| 曲麻莱县| 西丰县| 定兴县| 平谷区| 龙泉市| 景东| 连南| 洛隆县| 墨竹工卡县| 高雄市| 哈巴河县| 咸丰县| 枣阳市| 巴彦淖尔市| 昌黎县| 潮安县| 宿迁市| 历史| 三都| 龙口市| 项城市| 张家港市| 伊通| 黑河市| 阆中市| 湖州市| 攀枝花市| 乌什县| 桐柏县| 青河县| 霞浦县| 德昌县| 娄底市|