標籤彙整: Project Aria

Meta 開放 Project Aria Gen 2 研究申請 新一代裝置強化感測與 AI 運算能力

廣告

自 2020 年推出以來,Meta 的 Project Aria 計畫已成為全球研究界探索「人類視角 AI(egocentric AI)」的重要平台。這項計畫旨在以可穿戴裝置蒐集第一人稱資料,協助開發更具情境理解的人工智慧模型。根據官方數據,目前已有 27 個國家的近 300 間研究機構使用超過 1,000 台 Aria Gen 1 裝置,進行語言模型訓練、人機互動與機器人學等研究。

如今,Meta 宣布開放 Project Aria Gen 2 的研究申請,預計在 2026 年第二季向合格申請者發放新裝置。與前代相比,Aria Gen 2 在 感測精度、穿戴舒適性、互動能力與裝置端 AI 運算效能 方面都有明顯提升,並配備 Meta 自研的協同處理器以支援低功耗機器感知運算。裝置支援多樣感測元件,包括廣角攝影機、深度感測器、麥克風與眼動追蹤系統,使研究人員能更全面蒐集環境與行為數據。

為協助開發者與研究者了解新裝置的潛能,Meta 同步釋出 Aria Gen 2 白皮書 與 Pilot Dataset。白皮書詳細說明硬體架構、感測模組與 SDK 功能,並對比 Gen 1 與 Gen 2 的性能差異。Pilot Dataset 則展示裝置在多場景下的數據表現,包含手部追蹤、視覺慣性(VIO)、3D 點雲重建等範例。Meta 也與 NVIDIA FoundationStereo 合作,展示利用 Aria Gen 2 進行深度估計與立體視覺研究的成果,凸顯其在 人機互動與自動化研究 領域的應用潛力。

Meta 表示,新版本不僅是一款研究工具,更是推動「以人為中心的 AI」的重要里程碑。研究者可利用 Aria Gen 2 收集真實世界的人類行為資料,用於訓練多模態 AI 模型,推進語義理解、手勢識別、空間定位等多領域研究。

此外,Meta 將於 ICCV 國際電腦視覺會議(10 月 19 日於夏威夷舉行)現場展示 Aria Gen 2 的實機串流,並與 NVIDIA 共同舉辦講座與實作工作坊,展示裝置在 AI 深度估計與機器感知上的應用。

有意申請的研究機構可前往 Meta 官網填寫申請表,分為 學術企業 兩種管道。Meta 也提醒,Aria Gen 1 的申請通道已於公告日關閉,未來研究合作將全面轉向 Aria Gen 2。

Meta 開放 Project Aria 研究套件申請,推動多領域創新研究

廣告

Project Aria 自 Connect 2020 發布以來,旨在探索未來增強實境(AR)和人工智慧(AI)眼鏡所需的軟硬體技術。該計劃最初僅限於內部使用,但很快擴展至學術和研究界,並吸引了眾多頂尖機構參與。Meta 宣布開放 Project Aria 研究套件(ARK)申請,為更廣泛的研究團體提供機會,共同推動人機互動、電腦視覺、AI 應用等前沿科技的發展。

ARK 為合作夥伴提供的 Project Aria 眼鏡具備豐富的傳感器組件,可用於收集研究所需的各類數據。此外,機器感知服務(MPS)作為一種雲端服務,能基於數據提供額外標註和分析,協助研究人員更深入地理解所收集的數據。用戶端 SDK 則是 ARK 套件的重要工具,允許研究人員直接連接 Aria 眼鏡進行資料串流和即時數據分析,滿足複雜的原型設計需求。

ARK 套件具備靈活的配置選項,能夠依照研究目標進行調整。若研究主要關注數據集開發,研究人員可配備多套 Aria 眼鏡以進行資料收集,並利用 Project Aria Tools 平台進行數據管理和可視化處理。Project Aria Tools 屬於 Meta 的 OSI 產品,內含實用的數據工具和 API,為數據使用和可視化提供支援。

若研究目標是開發串流應用,研究人員可使用 Aria 眼鏡、行動伴侶應用以及用戶端 SDK,透過本機電腦進行即時數據串流,快速進行應用程序原型測試。無論是以數據為主的探索,還是應用程式開發,ARK 都能滿足不同的研究需求。

Project Aria 的 ARK 套件在提供豐富硬體設備之外,也為合作夥伴提供了雲端 API 服務,使研究人員得以專注於自身研究重點,開發出更多創新應用。ARK 的推出不僅讓更多研究者得以參與,還進一步推動了 AR 與 AI 科技的前進步伐,將人機互動和智慧應用帶入新時代。

申請 ARIA 研究套件:PROJECT ARIA RESEARCH KIT

Aria 研究套件 (ARK) ARK 是一個完整的研究生態系統,提供了 Project Aria 的眼鏡與多樣化工具,涵蓋具體 AI、HCI 和機器人學等多元領域。研究人員能透過 ARK 利用 Meta 的算法雲端服務進行分析,同時透過 Ego Blur 開源工具來模糊人臉和車牌,保障數據隱私。此外,ARK SDK 支援 Android 和 iOS,並可將 Aria 數據串流至電腦,方便進行即時原型設計,為研究提供高效支持。


布里斯托大學(University of Bristol):Ego-Exo4D 項目 布里斯托大學的研究人員利用 Aria 的豐富傳感器設備,進行「Ego-Exo4D」項目,以捕捉高技能人員的自我視角數據,創建三維空間地圖。該項目提供了新的方法來追蹤人與物的交互行為,有助於深入理解人們如何改變環境以達成目標。

愛荷華大學(University of Iowa):提升聽力障礙者的環境理解 愛荷華大學的研究團隊則著重於改善聽力障礙者在不同環境中的體驗。透過 Aria 的多麥克風陣列,研究人員能夠準確定位聲音來源,這些數據未來可能引領助聽技術的創新。

印度理工學院海德拉巴分校(IIIT Hyderabad):駕駛意圖預測項目 印度理工學院(IIIT Hyderabad)的研究人員利用 Aria 眼球注視數據進行駕駛意圖預測,旨在防止意外事故發生。透過 Aria 所生成的點雲數據,研究人員可以檢測駕駛者視野外的車輛,增強行車安全。

卡內基美隆大學(Carnegie Mellon University):NavCog 導航應用 卡內基美隆大學機器人學院的研究團隊正在利用 Aria 開發一款名為 NavCog 的導航應用,協助視障人士進行室內導航。Project Aria 幫助 NavCog 減少對藍牙信標的依賴,快速拓展可用環境,讓更多有需要的人受益。

Project Aria 的開放源代碼策略強調了數據共享和合作精神,並鼓勵研究社群開放他們利用 Aria 所構建的數據集和模型,以期加速科技創新並擴展應用範圍。