Meta 最新公開的 WorldGen 研究展示了生成式 AI 正在改變 3D 世界構建方式的速度。這套系統能從一句簡單的文字提示開始,自動產生可自由探索、可導航、風格統一且具備互動潛力的完整 3D 世界。過去生成式 AI 在 3D 領域的應用多半集中於單一物件、短片段或有限區域的場景,而 WorldGen 則將目標放在可實際用於遊戲、模擬與社交空間的「大型、連續、可行走的世界」,並且在生成品質與結構合理性上都呈現出顯著突破。
WorldGen 的技術由多階段組成,首先透過提示生成場景的概念規劃,包括世界底層佈局、建物位置與可行走區域,並建立程序化 blockout 與導航網格,確保最終世界可以讓角色實際在其中移動。接著系統會先產生一張全局參考影像,再利用 2D 圖像重建 3D 場景,並以整體視角推導空間結構,而不是只依靠單一相機角度。這也使得場景在玩家移動後,不會因離開中心視角而產生紋理崩壞或幾何變形。之後,WorldGen 會利用加速版 AutoPartGen 將場景拆解成可管理的物件與區域,例如牆面、地形、家具、植被等,使世界能夠被引擎正常載入、被創作者自由調整,也更便於後續優化。最後系統再進行紋理強化、mesh 修正與整體視覺一致性的細化,使場景在接近檢視時仍能呈現穩定細節。
相較於目前普遍以單一視角生成 3D 場景的方法,WorldGen 最大的差異在於空間完整性與規模擴展。許多現有生成工具即使能做出華麗影像,也常在玩家移動 3、5 公尺後畫面立即崩壞,或者在同一世界內混雜風格無關的物件。WorldGen 則在研究階段已能生成 50 x 50 公尺的統一場景,在建築、材質與空間邏輯上保持一致,並且能被直接匯入 Unity 與 Unreal 等遊戲引擎,無需額外轉檔或重新處理渲染流程。對產業工作流程而言,這代表未來開發者不必先用大量人力打造原型場景,而是可依靠 WorldGen 進行初版世界生成,再逐步投入風格化調整與互動設計。
儘管如此,Meta 強調 WorldGen 仍處於研究階段,尚未對外發布。現有版本仍在生成速度與世界最大規模上存在限制,也需要更深入的交互式物理支援。然而從研究展示來看,它已顯示 AI 生成世界的可行性正式跨過關鍵門檻,並朝向大型多人場景、訓練模擬、城市規劃與娛樂內容等領域擴展,而非僅作為展示材料。
WorldGen 所透露的方向與 Meta Connect 提出的願景一致:讓創作者不必依靠複雜工具或專業美術能力,而是透過自然語言描述就能生成完整虛擬世界。這不只減少開發成本,也重新定義 3D 創作的門檻。過去需要大量建模與美術協作才能完成的場景,未來可能只需一句描述與少量後製調整即可完成。從遊戲到企業訓練,再到混合實境的社交互動空間,WorldGen 展示的概念都指向同一個方向:虛擬世界的生產方式正在邁入 AI 時代,而世界的建造者,也將變得比以往更多。
