中證網(wǎng)
返回首頁(yè)

阿里云AI繪畫(huà)創(chuàng)作大模型通義萬(wàn)相亮相 已開(kāi)啟定向邀測(cè)

王可 中國(guó)證券報(bào)·中證網(wǎng)

  中證網(wǎng)訊(記者 王可)繼通義千問(wèn)之后,阿里云通義大模型家族迎來(lái)新成員。7月7日,在2023世界人工智能大會(huì)上,阿里云宣布AI繪畫(huà)創(chuàng)作大模型通義萬(wàn)相開(kāi)啟定向邀測(cè),該模型可輔助人類(lèi)進(jìn)行圖片創(chuàng)作,未來(lái)可應(yīng)用于藝術(shù)設(shè)計(jì)、電商、游戲和文創(chuàng)等應(yīng)用場(chǎng)景。阿里云智能集團(tuán)CTO周靖人表示,這是阿里云大模型全面掌握多模態(tài)能力的關(guān)鍵一步,該能力將逐步向行業(yè)客戶(hù)開(kāi)放。

  據(jù)介紹,通義萬(wàn)相在語(yǔ)義理解和圖片生成上均表現(xiàn)優(yōu)秀,首批上線(xiàn)3大能力:在基礎(chǔ)文生圖功能中,可根據(jù)文字內(nèi)容生成水彩、扁平插畫(huà)、二次元、油畫(huà)、中國(guó)畫(huà)、3D卡通和素描等風(fēng)格圖像;在相似圖片生成功能中,用戶(hù)上傳任意圖片后,即可進(jìn)行創(chuàng)意發(fā)散,生成內(nèi)容、風(fēng)格相似的AI畫(huà)作;該模型還在業(yè)內(nèi)率先支持圖像風(fēng)格遷移,用戶(hù)上傳原圖和風(fēng)格圖,可自動(dòng)把原圖處理為指定的風(fēng)格圖。

  通義萬(wàn)相基于阿里研發(fā)的組合式生成模型Composer,其可通過(guò)對(duì)配色、布局、風(fēng)格等圖像設(shè)計(jì)元素進(jìn)行拆解和組合,提供高度可控性和極大自由度的圖像生成效果,僅需一個(gè)模型即可支持多類(lèi)圖像生成類(lèi)任務(wù)能力,該研究成果已在國(guó)際AI頂會(huì)ICML 2023上發(fā)表。

  阿里云在現(xiàn)場(chǎng)展示了該模型生成圖片的效果,當(dāng)輸入“沉浸在全頁(yè)灰度涂色的迷人世界中,有一只老虎在曼陀羅寧?kù)o的森林中,畫(huà)面采用線(xiàn)條、筆畫(huà)”后,系統(tǒng)能迅速生成線(xiàn)條細(xì)節(jié)豐富的老虎圖片,如果繼續(xù)使用風(fēng)格遷移功能,還可隨意切換圖片風(fēng)格。

  在去年的世界人工智能大會(huì)上,阿里云“通義”大模型系列首次亮相,在此之后,通義千問(wèn)、通義聽(tīng)悟等模型和產(chǎn)品相繼推出,通義萬(wàn)相的問(wèn)世意味著阿里云在大模型領(lǐng)域已經(jīng)具備處理或生成文本、語(yǔ)音和圖片等模態(tài)的能力。目前,阿里云大模型正逐步走向千行百業(yè),已有超過(guò)30萬(wàn)企業(yè)申請(qǐng)測(cè)試通義千問(wèn),通義聽(tīng)悟累計(jì)用戶(hù)數(shù)達(dá)到36萬(wàn)。“多模態(tài)是大模型演進(jìn)的必然路徑,我們希望用不同模態(tài)的能力服務(wù)千行百業(yè),幫助企業(yè)全面擁抱智能化時(shí)代!敝芫溉吮硎。

中證網(wǎng)聲明:凡本網(wǎng)注明“來(lái)源:中國(guó)證券報(bào)·中證網(wǎng)”的所有作品,版權(quán)均屬于中國(guó)證券報(bào)、中證網(wǎng)。中國(guó)證券報(bào)·中證網(wǎng)與作品作者聯(lián)合聲明,任何組織未經(jīng)中國(guó)證券報(bào)、中證網(wǎng)以及作者書(shū)面授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。