分類彙整: 人工智慧AI

Android XR 與 Gemini 結合:Google 展示 XR 裝置新應用方向

廣告

在 2025 年的 Google I/O 開發者大會上,Google 正式介紹了旗下 Android XR 平台的最新進展,並說明如何與 Gemini 人工智慧助手整合,進一步推動頭戴式與穿戴式 XR 裝置的應用實例。此次發表聚焦於讓 AI 輔助功能從手機、手錶等平面設備延伸到視角共享的 XR 裝置上,提供更自然的互動方式。

Android XR 是 Google 專為虛擬實境(VR)與擴增實境(AR)設備所打造的作業系統架構,強調在 AI 時代背景下提供一致的平台支援。Google 表示,Android XR 裝置將能夠利用 Gemini 的語言理解與感知能力,根據使用者當下的視野與語音指令,在免持的情況下提供實用建議與操作。這項能力被應用於多項示範情境中,包括導航指引、即時翻譯、拍照與行程管理等。

在硬體合作部分,Google 與 Samsung 合作的 Project Moohan 頭戴式顯示器已確認將於 2025 年內推出,這款裝置預計支援 Android XR 並結合 Gemini,以提供沉浸式的視覺體驗與語意互動。除 Samsung 外,Google 也與晶片廠商 Qualcomm 協力,確保系統在效能與電力表現上的穩定性。

智慧眼鏡則是本次發表的另一項重點。Google 展示了一款基於 Android XR 平台運作的原型眼鏡,具備鏡頭、麥克風與揚聲器,並可透過手機提供應用支援。眼鏡亦可選配鏡片顯示模組,用於在不干擾他人的情況下即時顯示訊息與建議。現場展示的功能包含與朋友傳訊、查詢行程、啟用語音翻譯與快速拍照等。透過與 Gemini 整合,眼鏡能夠理解使用者所處環境,並根據語音或手勢操作提供回應。

針對穿戴式裝置的實用性,Google 強調產品的外型設計與配戴舒適度同樣重要,因此已與 Gentle Monster Warby Parker 等時尚眼鏡品牌合作,共同開發具備 Android XR 功能的智慧眼鏡。未來還將與 Kering Eyewear 等品牌擴大合作,期望提升智慧眼鏡在日常穿戴中的接受度與普及率。

在開發者生態方面,Google 表示 Android XR 的開發工具將於 2025 年下半年開放,提供軟硬體參考架構,以協助第三方開發者為該平台開發應用程式與內容。這些工具將支援手部追蹤、空間錨定、語音輸入與視線追蹤等核心 XR 功能,進一步擴展 Android 在空間運算領域的應用場景。

Android XR 結合 Gemini AI 的設計,延伸了 AI 與使用者互動的邊界,從原本的螢幕輸入轉為視角共享與語音導向。透過與硬體品牌與眼鏡廠商的合作,Google 將平台功能擴展至頭戴式顯示器與智慧眼鏡之中,試圖建構一套統一且具擴展性的 XR 生態系統。

【Meta 推出 AssetGen 2.0】重新定義 3D 資產生成的 AI 基礎模型

廣告

Meta 宣布推出最新一代的 3D 基礎模型——AssetGen 2.0,旨在透過文字或圖像提示,自動生成具備高幾何細節與優質紋理的 3D 資產。這項技術延續了 AssetGen 1.0 的核心理念,並進一步提升在幾何生成與紋理品質上的表現,為虛擬世界的構建帶來新的技術基礎。

AssetGen 2.0 結合了 Meta 內部開發的兩個模型:一個專注於生成 3D 網格,另一個則負責處理紋理。這次的更新重點在於引入單階段 3D 擴散方法,使得產出的網格不僅具備幾何一致性,還能呈現更為精細的結構細節。這項改進讓模型在處理角色或場景時,能更準確還原使用者輸入的概念或設計草圖。

在紋理處理方面,AssetGen 2.0 新增了多項技術,包括視圖一致性優化、紋理修復與高解析度生成等。這些功能的加入不僅提升了紋理的自然性,也改善了在不同角度觀看下的表現,使最終產出的 3D 模型更適合實際應用,例如動畫、虛擬角色設計或遊戲開發。

目前,AssetGen 2.0 已在 Meta 內部使用,並被應用於 Horizon 與 Avatar 平台上的創作流程。Meta 表示未來幾個月內,這項技術將開放給更多創作者,幫助他們更快速地建立 3D 世界。藉由簡單的文字或圖像輸入,創作者可依序生成單一物件、結構,甚至整體場景,實現自動化且具備一致風格的空間設計。

Meta 表示,AssetGen 2.0 的開發目標之一,是讓 3D 資產創作能夠像 2D 繪圖一樣普及與直覺,並進一步推動創作者生態系的成長。該模型將作為未來全自動 3D 場景生成的核心構件,為產業界提供更高效率的解決方案。

使用 AssetGen v2 產生的紋理網格

使用 AssetGen v2 產生的可動畫角色

使用 AssetGen v2 產生的場景

Meta 推出 LlamaCon 2025 開發者大會,Llama 模型持續擴展應用與影響力

廣告

Meta 宣布將於 2025 年 4 月 29 日舉辦 LlamaCon 開發者大會,旨在分享 Llama 開源 AI 模型的最新進展,並提供開發者更多技術支援與應用機會。Llama 系列模型近年來在全球範圍內快速成長,下載量已突破 6.5 億次,並且在過去三個月內翻倍。隨著 AI 模型的持續優化與擴展,Meta 計劃透過 LlamaCon 與開發者進行更緊密的交流,推動 AI 技術的發展與應用。

Llama 作為 Meta 推出的開源大語言模型(LLM),在 2024 年經歷了數次重大升級,包含 Llama 3、Llama 3.1(推出 405B 模型)、Llama 3.2(首款多模態模型),以及 Llama 3.3 70B 版本,該版本在提供與 405B 模型相近性能的同時降低了運行成本。Llama 的開放特性使其迅速成為全球採用率最高的 AI 模型之一,目前全球下載量已超過 6.5 億次,並且在美洲、歐洲、亞太及新興市場的採用率持續增長。

為滿足不斷增長的需求,Meta 與多家科技公司展開合作,包括 Amazon Web Services(AWS)、AMD、Microsoft Azure、Databricks、Dell、Google Cloud、NVIDIA、IBM watsonx、Oracle Cloud、ScaleAI 等,確保 Llama 可在各種運行環境下發揮最佳效能。根據 Meta 公布的數據,Llama 在主要雲端合作夥伴的月度運行 token 數量在 2024 年 9 月達到了 50% 的月增長率,顯示企業對於開源 AI 模型的需求正在大幅提升。

除了開發者社群,越來越多企業與政府機構也開始將 Llama 模型應用於實際業務。Meta 近期推出 Llama Stack,為企業提供標準化工具鏈,使其能夠更輕鬆地定制 Llama 模型,並開發基於 AI 的應用系統。

  • IBM:將 Llama 整合至 watsonx.AI 平台,為全球 AI 企業開發者提供訓練、驗證、調整與部署能力。此合作讓 Llama 被應用於地方政府、電信公司,甚至是職業足球俱樂部的人才招募。
  • Block(Cash App 開發商):將 Llama 用於客服系統,透過開源架構靈活調整模型,提高客戶支持的自動化程度,同時確保數據隱私。
  • Accenture:為國際組織開發基於 Llama 3.1 的 AI 聊天機器人,該應用在 AWS 運行,具備可擴展性與高效處理能力。
  • Spotify:透過 Llama 強化個性化推薦系統,讓 AI 提供更具針對性的音樂推薦與背景介紹。
  • LinkedIn:使用 Llama 進行 AI 訓練,開發更適合社交平台需求的 LLM,並優化運行成本與效能。

除了企業應用,政府機構對 Llama 的興趣也在提升:

  • 美國政府:開始探索 Llama 在數據處理與公共服務領域的應用。
  • 印度技能發展與創業部(MSDE):計畫利用 Llama 提升學習系統與學生支援。
  • 阿根廷政府:已將 Llama 應用於 WhatsApp AI 聊天機器人,提升政府公共服務的自動化與回應速度。

Meta AI 助理擴展應用,進入社交與穿戴設備

Llama 模型的發展也推動了 Meta AI 助理 的廣泛應用。該 AI 助理目前在 WhatsApp、Instagram、Facebook、Messenger 等平台運行,每月活躍用戶數已接近 6 億,預計將成為全球使用量最高的 AI 助理。Meta 預計在 2024 年底前,將 Meta AI 擴展至 43 個國家與 12 種語言,進一步提升全球影響力。

此外,Meta 也在探索 AI 技術與穿戴設備的整合:

  • Ray-Ban Meta 智能眼鏡:內建 Llama 模型,讓使用者可透過語音與 AI 互動,而無需使用手機。目前該功能已開放至法國、義大利、愛爾蘭、西班牙等地。
  • AI Studio:自 2024 年 7 月推出後,已成為創作者開發 AI 角色的主要平台,至今已有超過 數十萬個 AI 角色 被創建。2025 年,Meta 計畫將 AI Studio 打造成全球領先的 AI 角色創建平台。

進入 2025 年,Meta 計畫加速推動 Llama 模型的發展,Llama 4 將推出多個版本,進一步提升 AI 在 語音、推理 等領域的能力。Meta 預測,AI 互動將逐漸從文本轉向語音,並計畫在 2025 年上半年 強化 AI 語音技術,使其更具對話性與實用性。

  • Meta Movie Gen:已開發 AI 影片生成技術,未來可能會整合至 Meta 旗下應用,提供更強大的 AI 影片創作與編輯能力。
  • Agentic AI(智能代理 AI):Meta 正在測試企業 AI 助理,可處理顧客服務、商業交易等任務,未來可能發展出更多自主處理工作的 AI 助理。
  • AI 廣告與商業應用:Llama 目前已被應用於 Advantage+ Creative 廣告生成工具,協助企業自動產生文本、圖像與影片廣告,提升行銷效率。

Meta 推出的 LlamaCon 2025 將成為開發者與企業探索 Llama 模型技術的全新平台,隨著 AI 模型的持續演進,Llama 已成為開源 AI 生態系統中的重要組成部分。未來,Meta 計畫透過不斷創新與開放合作,使 Llama 成為 AI 技術的標準,並加速 AI 技術在語音、影像、商業應用等領域的發展。

Meta 穿戴裝置新佈局:AI與智慧科技的未來之路

廣告

Meta近年來在穿戴裝置領域不斷深耕,目標是將人工智慧技術融入更多日常硬體產品中,從而重新定義人們的使用習慣與科技互動方式。從智慧眼鏡到智能手錶,再到嶄新的AI耳機,Meta的計畫涵蓋多個方向,顯示出其對穿戴裝置市場的長遠佈局與深厚的研發實力。

目前,Meta已推出的 Ray-Ban 智慧眼鏡具備拍照、音樂播放及簡易環境分析功能,成為智慧型手機的輔助設備之一。然而,這款產品仍未實現完整的擴增實境功能。為此,Meta計畫將Ray-Ban眼鏡推廣至更多市場,同時與 Luxottica 集團旗下品牌合作,開發專為運動員設計的 Oakley 版本智慧眼鏡。該版本將鏡框中的攝像頭位置調整至中央,更加適合運動需求。

Meta也正積極準備推出代號為“Hypernova”的高端智慧眼鏡,計畫於2025年上市。這款眼鏡內建小型顯示螢幕,能在鏡片上投射通知、簡易應用程式和照片,售價約為1,000美元,定位高端消費者市場。為了增強使用體驗,Meta還開發了一款腕帶式控制器,讓用戶可以更直觀地操控智慧眼鏡,並有望與Hypernova同步上市。

在實現真實擴增實境方面,Meta的計畫可分為多個階段。2026年,Meta將針對開發者推出代號為“Orion”的AR眼鏡原型,協助應用程式的開發與測試。隨後,真正面向消費者的“Artemis”AR眼鏡預計於2027年上市,這款產品將在重量、顯示技術及製造成本等方面有顯著突破,成為科技市場中重要的里程碑。

除了智慧眼鏡,Meta也重新啟動了智能手錶的研發計畫,並計畫於今年推出新產品。這款手錶除了具備傳統功能外,還將與智慧眼鏡無縫整合,例如顯示眼鏡拍攝的照片等。若能成功上市,Meta的智能手錶將進一步加強其穿戴裝置生態系統,成為與Apple Watch競爭的重要產品。

在耳機領域,Meta正研發一款名為“Camera Buds”的AI耳機。這款產品內建攝像頭與人工智慧技術,用戶可通過耳機分析環境中的物件並進行互動。儘管開發尚處早期階段,Meta對這款產品寄予厚望,希望能憑藉創新功能進入耳機市場。然而,該耳機目前面臨設計與實用性方面的挑戰,能否成功上市仍取決於後續的技術突破。

Meta的穿戴裝置計畫展現出其對硬體創新與AI結合的長期願景,試圖打造一個無需手機即可全面互聯的未來生態系統。從Ray-Ban智慧眼鏡的市場擴展,到即將推出的高端Hypernova眼鏡,再到針對AR的Orion與Artemis計畫,Meta正以穩健的步伐推進,致力於將AI科技深度融入每個人的日常生活。

「Best Shot! HORROR Film Competition」VIVE Mars 首創恐怖影像競賽,展現虛擬製作技術潛力

廣告

HTC VIVE 近日推出了一項全新的恐怖主題虛擬製作影像競賽——「Best Shot! HORROR Film Competition」。這項比賽旨在利用 VIVE Mars 技術,為全球的專業影像創作者與學生提供展現虛擬影像創作能力的舞台,同時促進影像製作技術的應用與普及。

此次比賽的技術核心為 VIVE Mars CamTrack,這是一款為虛擬製作量身打造的創新相機追蹤解決方案。VIVE Mars CamTrack 擁有操作簡單、靈活且高性價比的特點,兼容 Unreal Engine,能夠提供專業級的精準追蹤效果。無論是在小型工作室、教育機構或大型影棚中,該技術都能透過其緊湊設計和快速鏡頭校準,幫助創作者輕鬆實現震撼的影像效果。

MSI 提供了人工智慧特別獎項,鼓勵參賽者在影像製作中運用 AI 技術。參賽者利用 AI 進行故事板繪製、音樂創作、圖像生成等,展現了 AI 在影像製作中的潛力與創意。有作品甚至運用 ChatGPT 撰寫歌詞,進一步拓展了創作者的表現形式,充分體現了科技賦能的魅力。

參賽作品由多位影像與虛擬製作領域的專家共同評審,包括 Studio BCinematography DatabaseDossGuavaXR StudioAndyaxCinePacks 業界翹楚。評審團根據創意、技術執行力及驚嚇效果等標準,精選出技術與敘事表現皆優秀的作品。

透過本次競賽,VIVE Mars 展示了虛擬製作技術在不同層面上的應用可能性。無論是專業團隊還是學生作品,都能看到參賽者以創意與技術結合所帶來的多樣化呈現。

Nas.io推出Ruby AI:革命性人工智慧助力Whatsapp社群

廣告

隨著科技日新月異的發展,人工智慧正引領著各行各業的變革,而Nas.io所推出的Ruby AI便是其中一項為Whatsapp社群提供服務的嶄新人工智慧助手。

現今社交媒體的普及,使得社群訊息的流量不斷攀升。然而,訊息的洪流也給人們帶來了閱讀的負擔。繁瑣的大量訊息往往使得人們花費過多時間於閱讀,有時甚至因時間不足而放棄閱讀訊息。這正是Nas.io Ruby AI的用意所在,該AI能夠幫助用戶輕鬆總結群聊內容,將超過500條的對話轉化為一份簡潔的摘要,節省寶貴的閱讀時間。

Ruby AI的特點包括:

簡潔摘要生成: Ruby AI能夠將聊天群中相關信息智能地總結,並自動發送至用戶收件箱。

輕鬆查閱對話歷史: 用戶可以根據日期輕鬆查閱過去的對話總結,方便追溯交流內容。

無縫分享功能: 用戶還能夠輕鬆地將這些摘要分享給其他成員,提供便捷的資訊分享方式。

Nas.io的Ruby AI的推出將為廣大用戶帶來極大的便利,有助於提升閱讀效率,同時降低閱讀時間成本。Nas.io表示,他們將持續努力,未來還有可能將推出Ruby AI的LINE社群版本,為更多社交平台的用戶提供服務。

無疑,Nas.io的Ruby AI將成為Whatsapp社群的得力助手,也是人工智慧發展下的又一力作。無論是面對龐大的對話紀錄,還是需要迅速獲取訊息核心。讓我們期待Ruby AI帶來的無限可能!


GPTBot: OpenAI 發布新的網絡爬蟲改進AI模型的安全性

廣告

OPenAI推出了GPTBot,用來推動GPT-4和即將問世的GPT-5,主要是從互聯網上獲取公開網站的數據,增強的人工智慧AI的模型,人工智慧有了很大的成長。

OpenAI 表示:「使用 GPTBot 爬取網路資料是為了改進 AI 模型的準確性、功能性和安全性。」

雖然允許或禁止GPTBot網絡爬蟲會提升網站數據隱私,但仍然有法律上的問題,而網路上有一群人掀起了筆戰。

有人質疑 GPTBot 的網站上授權圖片、影片、音樂和其他媒體;也有人說可以做到共享利潤。

只是站在原創者角度,又有誰願意共享利潤呢? 這絕對是一個需要解決的問題。

以下是OPenAI提供的字串: 

GPT機器人

Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

禁止 GPTBot

User-agent: GPTBot

Disallow: /

自定義 GPTBot 訪問

要允許 GPTBot 僅訪問您網站的部分內容,您可以將 GPTBot 令牌添加到您網站的 robots.txt,如下所示:

User-agent: GPTBot

Allow: /directory-1/

Disallow: /directory-2/

OpenAI OpCo, LLC 已向美國專利商標局 (USPTO) 提交了“GPT-5”商標申請。該申請於 2023 年 7 月 18 日提交,目前正在處理中。

OpenAI 首席執行官 Sam Altman 討論了 GPT-5 的開發。

“We have a lot of work to do before GPT 5. It takes a lot of time for it. We are not certainly close to it. There needs to be more safety audits. I wish I could tell you about the timeline of the next GPT”

“在 GPT 5 之前我們還有很多工作要做,需要花費很多時間。我們肯定還沒有接近它。需要進行更多的安全審核。我希望我能告訴你下一個 GPT 的時間表”

Facebook 季度業績分享:強勁參與度與令人興奮的未來路線圖

廣告

Mark Zuckerberg最近分享了Facebook的季度業績報告,展示了應用程序的強勁參與度和令人興奮的未來路線圖。Facebook在多個方面取得了良好進展,包括Reels、Threads、Llama 2和一些正在開發中的突破性人工智能產品,以及即將推出的Quest 3。讓我們來看看這些關鍵的發展和Facebook的未來展望。

Facebook的應用程序持續吸引著全球超過38億人每月的使用者。Facebook每月活躍人數超過30億,且全球每日活躍人數不斷增長,其中包括美國和加拿大等地。這些數字反映了Facebook在社交媒體市場上的強大地位,並且顯示了用戶對其平台的忠誠度和參與度。

Facebook取得了在Reels和Threads等項目方面的良好進展。Reels在Facebook和Instagram上的每日播放量超過2000億次,這使得Reels成為探索引擎的關鍵部分。與此同時,Threads取得了前所未有的增長,並且每天返回的用戶數量超出了預期。這些成功都促使Facebook專注於保留和改進基礎知識,並計劃將社區進一步擴大。

Facebook一直在大力投資人工智能,並在近期看到了回報。人工智能推薦內容是Facebook上增長最快的內容類別之一,並且自從引入這些建議以來,用戶在平台上的總花費時間增加了7%。Reels的成功也得益於人工智能的應用。此外,Facebook還推出了一些人工智能驅動的產品,例如Meta Advantage和Meta Lattice,這些產品推動了廣告工具的改進和盈利。

Facebook一直在大力投資人工智能,並在近期看到了回報。人工智能推薦內容是Facebook上增長最快的內容類別之一,並且自從引入這些建議以來,用戶在平台上的總花費時間增加了7%。Reels的成功也得益於人工智能的應用。此外,Facebook還推出了一些人工智能驅動的產品,例如Meta Advantage和Meta Lattice,這些產品推動了廣告工具的改進和盈利。

總體而言,Facebook在季度業績中表現出色,並展望了一個充滿希望和潛力的未來。他們的應用程序持續吸引著數十億用戶,Reels和Threads等功能取得了令人興奮的成功,而對人工智能和虛擬宇宙的投資將為公司帶來更多增長機會。Facebook致力於提供更好的用戶體驗,同時保持營收的穩定增長,並在未來幾年繼續領先社交媒體行業的發展。我們期待著看到Facebook如何實現這些令人期待的目標,並為用戶帶來更多驚喜和創新。