OpenAI 發佈Sora,影視行業或迎鉅變時刻。Open AI發佈Sora,可生成長達一分鐘的視頻。OpenAI正在教AI理解和模擬現實中的運動,以幫助人類解決與現實交互的問題。Sora 是一種通用的視覺數據模型,它可以生成不同持續時間、縱橫比和分辨率的視頻和圖像,最多可生成一整分鐘的高清視頻。從性能上看,首先,Sora具有可選擇的視頻時長、分辨率和畫面比例。傳統的視頻和圖像生成通常將視頻素材裁剪或修剪爲標準大小,Sora則以原生大小對數據進行訓練,這種方式帶來了靈活性及優化的取景和構圖。其次,Sora具有很強的語言理解能力。
OpenAI首先訓練了一個高度描述性的字幕器模型,然後使用它爲訓練集中的視頻生成文本字幕。OpenAI還利用GPT 將簡短的用戶提示轉換爲更長的詳細字幕,然後發送到視頻模型,這使得Sora 能夠準確遵循用戶提示生成高質量的視頻。最後,除了用文本之外,Sora還可以用圖像和視頻進行提示,執行各種圖像和視頻編輯任務——創建完美循環的視頻、爲靜態圖像製作動畫、在時間上向前或向後擴展視頻等。
Google發佈Genimi 1.5,性能超越GPT-4 Turbo
Genimi 1.5是迄今谷歌的最大模型,目前已經發布了Genimi 1.5 Pro版本。Genimi 1.5 Pro帶有128000個token的上下文窗口,開發人員和企業客戶可以通過AI Studio和Vertex AI在個人預覽版本中試用最多100萬個token的上下文窗口。這意味着Genimi 1.5 Pro可以一次性處理1小時的視頻、11小時的音頻、超過3萬行代碼和70萬文字。架構方面,Genimi 1.5建立在Transformer 和MoE 架構的研究之上。根據谷歌公佈的論文數據,橫向對比看,Genimi 1.5 Pro的文本、音視頻處理能力幾乎全面超越GPT-4Turbo。縱向對比看,Genimi 1.5 Pro性能大幅超越Genimi 1.0Pro,小幅領先Genimi 1.0Ultra。
Altman萬億美元融資曝光,AI 芯片行業或將重塑
根據《華爾街日報》週四晚間的報道,奧特曼正考慮一個項目,旨在增加全球芯片製造能力,並已開始與各種投資者進行接觸,其中包括阿聯酋政府。若融資能落地,或將重塑半導體芯片行業。據半導體工業協會(SIA)預測,到2024年,全球芯片行業的銷售額將增長13%,達到5953億美元。這標誌着與去年下跌8%相比的較大增長。而若以市值計算,如果奧特曼能夠籌集到7萬億美元,他甚至可以收購整個芯片行業,包括Nvidia、TSMC、Broadcom、ASML、Samsung、AMD、Intel等公司
Comments