10月9日,美圖公司舉辦15周年生日會(huì)并發(fā)布自研AI視覺大模型MiracleVision(奇想智能)3.0版本。面世100天后,美圖AI視覺大模型MiracleVision3.0將全面應(yīng)用于美圖旗下影像與設(shè)計(jì)產(chǎn)品,并將助力電商、廣告、游戲、動(dòng)漫、影視五大行業(yè)。
美圖視覺大模型的100天進(jìn)化:奇思妙想與智能創(chuàng)作
在美圖公司15周年生日會(huì)現(xiàn)場(chǎng),美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻發(fā)布了自研AI視覺大模型MiracleVision3.0版本。
美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻
吳欣鴻介紹說,三個(gè)月前,MiracleVision繪畫水平還停留在初級(jí)階段,如今3.0版本已經(jīng)能描繪出真實(shí)細(xì)膩的畫面細(xì)節(jié),目前用戶可以訪問AI視覺創(chuàng)作工具“WHEE”官網(wǎng)體驗(yàn)。
吳欣鴻將自己15歲的繪畫作品與面世100天的美圖視覺大模型生成作品進(jìn)行對(duì)比,他認(rèn)為訓(xùn)練AI與人類學(xué)畫有很多共通之處,通過充分學(xué)習(xí)不同的繪畫風(fēng)格和技巧,AI能創(chuàng)作出具有獨(dú)特性的原創(chuàng)作品。
美圖公司將自研AI視覺大模型MiracleVision(奇想智能)的核心能力拆解為“奇思妙想”和“智能創(chuàng)作”兩大特性。
在“奇思妙想”層面,MiracleVision通過“提示詞智能聯(lián)想”功能降低大眾的使用門檻,當(dāng)用戶輸入關(guān)鍵詞,MiracleVision可自動(dòng)補(bǔ)充相關(guān)表述,如光影效果、質(zhì)感、風(fēng)格、圖片質(zhì)量等,推動(dòng)創(chuàng)作平權(quán)。此外,MiracleVision通過“提示詞精準(zhǔn)控制”功能來滿足更加專業(yè)的設(shè)計(jì)要求,如使用“近景”、“遠(yuǎn)景”、“順光”、“逆光”等描述控制最終生成效果。
在“智能創(chuàng)作”層面,MiracleVision通過“深化創(chuàng)作”功能,可以進(jìn)一步豐富作品細(xì)節(jié)和提升表現(xiàn)力。通過“AI畫面擴(kuò)展”功能讓作品尺寸更大、細(xì)節(jié)更豐富。通過“局部修改”功能,對(duì)部分畫面進(jìn)行精準(zhǔn)修改與調(diào)整。通過“分辨率提升”功能生成高清大圖,讓細(xì)節(jié)表現(xiàn)、色彩展示、物體辨識(shí)更加的精準(zhǔn)和生動(dòng)。
助力電商、廣告、游戲、動(dòng)漫、影視五大行業(yè)
在吳欣鴻看來,AI視覺大模型帶來的不僅僅是更好的視覺呈現(xiàn),還有對(duì)工作流的效率提升,但目前大模型與工作流的結(jié)合仍在探索階段,抓住應(yīng)用場(chǎng)景的核心需求更為重要。
吳欣鴻介紹說,MiracleVision將落地電商、廣告、游戲、動(dòng)漫、影視五大行業(yè),希望能幫助五大行業(yè)“工作流提效”。
在電商行業(yè),從涂鴉生成線稿、線稿上色、商品圖、模特試穿圖,再到電商物料輸出,全程可通過MiracleVision實(shí)現(xiàn)。
在廣告行業(yè),MiracleVision覆蓋創(chuàng)意腦暴、創(chuàng)意深化、平面排版、多尺寸延展、線下投放預(yù)覽的全工作流,助力客戶在廣告物料制作環(huán)節(jié)提效。
在游戲行業(yè),MiracleVision可以包攬場(chǎng)景設(shè)計(jì)、角色設(shè)計(jì)、道具設(shè)計(jì)、UI圖標(biāo)、宣發(fā)物料等流程,拓寬設(shè)計(jì)師想象空間的同時(shí)助力游戲行業(yè)降本。
在動(dòng)漫行業(yè),MiracleVision打通了概念設(shè)計(jì)、故事板生成、線稿上色、動(dòng)漫補(bǔ)幀、視頻轉(zhuǎn)動(dòng)漫等流程,支持創(chuàng)意到物料成品的快速落地。
在影視行業(yè),MiracleVision的高可控性可充分滿足概念場(chǎng)景設(shè)計(jì)、分鏡設(shè)計(jì)、人物造型、道具設(shè)計(jì)、宣發(fā)物料的效果要求,極大提升影視行業(yè)設(shè)計(jì)環(huán)節(jié)的效率。
吳欣鴻表示,MiracleVision將充分發(fā)揮奇思妙想、智能創(chuàng)作的能力,在上述五大行業(yè)深耕,持續(xù)助力更多的設(shè)計(jì)場(chǎng)景。
視覺大模型應(yīng)用普及將在2026-2030年走向成熟期
活動(dòng)現(xiàn)場(chǎng),吳欣鴻還分享了對(duì)于AI視覺大模型的思考。“AI視覺大模型的本質(zhì),是無窮無盡的視覺創(chuàng)意庫。應(yīng)用層相當(dāng)于內(nèi)容提取器,根據(jù)用戶的需求,從這個(gè)巨大的創(chuàng)意庫中提取所需要的內(nèi)容,讓用戶在特定場(chǎng)景中使用。AI視覺大模型和應(yīng)用之間相輔相成,大模型為應(yīng)用提供技術(shù)支撐,應(yīng)用反哺大模型的效果迭代。”
吳欣鴻表示,目前AI視覺大模型在生產(chǎn)端的三個(gè)待解決的問題是:垂直領(lǐng)域的極致效果、工作流整合、變現(xiàn)能力。隨著AI視覺大模型和生產(chǎn)端的磨合,這三個(gè)問題會(huì)被逐步解決。
在吳欣鴻看來,視覺大模型應(yīng)用普及將經(jīng)歷三個(gè)階段:2024年之前為探索期,2024-2025年為高速發(fā)展期,2026-2030年為成熟期,隨著視覺大模型在生產(chǎn)端的應(yīng)用走向成熟,視覺大模型將助力千萬設(shè)計(jì)場(chǎng)景,引領(lǐng)美學(xué)的升級(jí)與社會(huì)經(jīng)濟(jì)增長。
此外,美圖公司還公布了6月19日發(fā)布的影像生產(chǎn)力工具最新數(shù)據(jù):AI視覺創(chuàng)作工具“WHEE”的優(yōu)質(zhì)AI效果生成數(shù)已超過550萬張,打造的設(shè)計(jì)師生態(tài)也初見成效;AI口播視頻工具“開拍”月活躍用戶數(shù)已突破35萬;桌面端AI視頻編輯工具“WinkStudio”已累計(jì)服務(wù)近10萬名視頻創(chuàng)作者;主打AI商業(yè)設(shè)計(jì)的“美圖設(shè)計(jì)室”正助力近百萬中小電商賣家降本增效;美圖AI助手“RoboNeo”每天幫助近萬名用戶自動(dòng)修圖,比傳統(tǒng)修圖效率提升35%;AI數(shù)字人生成工具“DreamAvatar”于8月底上線并主打“AI演員”數(shù)字人服務(wù)。
標(biāo)簽: AI 大模型 MiracleVision 美圖 故事板