用戶名: 密碼: 驗證碼:

多模態AI下一步是3D內容生成? 新工具已火爆GitHub

摘要:多模態內容生成展示了AIGC廣闊的應用空間, 3D有望成為下一個實現突破的模態。

  ICC訊 多模態內容生成展示了AIGC廣闊的應用空間, 3D有望成為下一個實現突破的模態。

  近期,一款名為DUSt3R的AI新工具火爆微軟旗下GitHub平臺,只需2張圖片2秒鐘就能完成3D重建,無需測量任何額外數據。這款AI工具才上線沒多久就登上GitHub熱榜第二。有網友實測,拍兩張照片就重建出了他家的廚房,整個過程耗時不到2秒鐘。

  3D模型生成通常需要MVS估計相機參數,并在3D空間中對相應的像素進行三角測量。該產品同原來不一樣的是,它是一種對任意圖像進行3D立體重建的全新范式,不需要相機校準以及視點姿態等先驗信息。從而可以實現提供兩個以上圖像的情況下,進行3D建模重建。

  3D建模指的是使用軟件來創建三維對象或形狀的數學表示形式的過程。3D建模技術和3D模型廣泛應用于醫療、游戲、影視、建筑、產品設計還是虛擬現實等領域。

  AI+3D建模是利用人工智能技術,自動化地生成高質量的3D模型的過程。傳統的3D建模需要藝術家花費大量時間和精力進行手工創作,而AI生成則通過訓練機器學習算法,使計算機能夠自動學習和生成3D模型,極大地提高了效率和準確性,同時降低了整個制作成本。

  用戶只需要輸入關鍵詞或者上傳一張2D圖片,這些工具就能在段時間內直接生成多個比較初步的3D模型,而用戶滿意的話,則可以選擇進一步生成精度更高的3D模型。

  當下的3D內容生成工具已經不少,目前海外在AI+3D技術上主要分為工業場景探索與非工業場景探索。非工業場景應用探索主要以谷歌的DreamFusion和英偉達的Magic3D為代表,主要面向游戲、元宇宙中的3D資產設計;工業場景應用則主要以衍生式設計軟件為主,如PTC的Creo以及Autodesk的Fushion360均提供衍生式設計能力。

  國內比較知名的3D生成AI模型包括:字節跳動研究團隊開發的MVDream;由幻方量化旗下的一家大模型企業DeepSeek開發的DreamCraft3D;影眸科技從2016年開始進行人臉采集生成3D模型的業務。據該公司CTO張啟煊介紹,其人臉生成3D的服務,應該是目前國內3D生成里面唯一一個走進游戲生產端的產品……

  用戶輸入文本:“奔跑在樹林中,搞笑的豬頭和孫悟空身體的混合形像”,DreamCraft3D生成的內容

  從ChatGPT代表的文生文,到DALL?E代表的文生圖,再到Sora代表的文生視頻,多模態已經成為了共識的AI發展趨勢。中泰證券旗幟鮮明地提出,繼文本、代碼、圖片、視頻之后,下一個有可能實現突破的模態大概率是3D,“SORA之后的下一步:文生3D”。未來隨著數字化的持續發展,3D資產數量的快速增長,3D建模的自動化生成或成為新的發展風口,而以各種大模型為代表的AIGC生產能力賦能3D建模,以及文生3D需求持續增長,都將促進AI賦能3D建模的快速發展。

  不過AI+3D建模技術當前也面臨較多挑戰,如3D數據與資產缺乏、AI訓練難度高、AI實時渲染技術有限、商業化落地難度大等問題。

  該機構進一步稱,產業視角建議持續跟蹤關注文生3D建模領域的進展,標的視角BIM領域重點關注廣聯達、盈建科;CAX領域重點關注中望軟件、索辰科技、浩辰軟件;EDA領域重點關注華大九天、概倫電子。

內容來自:財聯社
本文地址:http://www.ouliali.com.cn//Site/CN/News/2024/03/05/20240305030430945542.htm 轉載請保留文章出處
關鍵字:
文章標題:多模態AI下一步是3D內容生成? 新工具已火爆GitHub
1、凡本網注明“來源:訊石光通訊網”及標有原創的所有作品,版權均屬于訊石光通訊網。未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載我方內容的單位,也必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。
2、免責聲明,凡本網注明“來源:XXX(非訊石光通訊網)”的作品,均為轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。因可能存在第三方轉載無法確定原網地址,若作品內容、版權爭議和其它問題,請聯系本網,將第一時間刪除。
聯系方式:訊石光通訊網新聞中心 電話:0755-82960080-168   Right
国产精品专区第102页_狼友网精品视频在线观看_欧美怡春院一区二区三区_一级做a爰片久久毛多水多