亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app

成就了Sora和Stable diffusion 3的DiTs:究竟是啥

訪客 2年前 (2024-02-25) 閱讀數 339 #區塊鏈
文章標簽 前沿文章

作者|苗正

Sora才剛發布沒過多久,Stable AI就發布了Stable Diffusion 3。對于使用人工智能創意設計的人來說,無疑是過大年了。那么本篇文章就專門為這些用戶準備,用更直白的話講述Stable Diffusion 3的兩大特色“擴散transformers模型”以及“流匹配”,幫助你在模型發布后更好的使用它來創作。

擴散transformer模型(diffusion transformers),我們下文就簡稱它為DiTs。那看名字你也清楚了,這是一個基于transformer架構的圖像潛變量擴散模型。如果你讀過硅星人Pro的文章《揭秘Sora:用大語言模型的方法理解視頻,實現了對物理世界的“涌現”》,那么你對于接下來的內容來說已經算是“課代表”級別的了。DiTs跟Sora一樣,它也使用了“塊”(patches)這個概念,不過由于DiTs是用來生成圖片的,它不需要像Sora那樣保持不同幀圖片之間的邏輯關聯,所以它不必生成時間和空間的時空塊。

Stable diffusion 3生成

對于DiTs來說,它和4、5年前在計算機視覺領域掀起一場腥風血雨的Vision Transformer (ViT) 是相似的,圖像會被DiTs被分割成多個patches,并嵌入到連續向量空間中,形成序列輸入供transformer處理。不過這里要注意,因為DiTs是有業務在身的,所以對于條件圖像生成任務,DiTs就需要接收并融合外部條件信息,例如類別標簽或文本描述。通常通過提供額外的輸入標記或者跨注意力機制來實現,使得模型能夠根據給定的條件信息指導生成過程。

那么當這個塊抵達DiTs內部的時候呢,他就可以被DiTs內部的DiT block來加工成需要的內容了。DiT block是DiTs最核心的一環,它是一種設計用于擴散模型的特殊transformer結構,能夠處理圖像和條件信息。一般來說,block本身翻譯過來就是塊,但是為了和patches做區分,所以這里我直接用block。

Stable diffusion 3生成

DiT block又分為三個小block:交叉注意力、adaLN、adaLN-Zero。交叉注意力指的是在多頭自注意力層之后添加了一個額外的多頭交叉注意力層,它的作用是利用條件信息來指導圖像生成,使生成的圖片更符合提示詞,不過代價是增加了大約15%的計算量。

adaLN中的LN,指的是通過規范化每一層神經網絡內部單元的輸出,以減少內部協變量偏移(covariate shift)的問題,進而改善模型訓練過程中的收斂速度和性能。那adaLN就是對標準層歸一化的擴展,它允許層歸一化的參數根據輸入數據或附加條件信息動態調整。它就和汽車那個懸掛一樣,是用來增加模型穩定性和適應性的。

Stable diffusion 3生成

接下來,Stable AI在adaLN DiT block的基礎上進行了一項改進,除了回歸γ和β之外,還回歸維度級的縮放參數α,并在DiT block內的任何殘差連接之前立即應用這些參數。而這一個block就是adaLN-Zero,這樣做的目的是為了模仿殘差網絡中的有益初始化策略,以促進模型的有效訓練和優化。

經過DiT block后,token序列就會解碼為輸出噪聲預測和輸出對角協方差預測。通過標準線性解碼器,這兩個預測結果的大小和輸入圖像的空間維度相同。最后是將這些解碼后的令牌按照它們原有的空間布局重新排列,從而得到預測出的噪聲值和協方差值。

Stable diffusion 3生成

第二章,流匹配(Flow Matching,下文簡稱FM)。根據Stable AI的說法,是一種高效的、無需模擬的CNF模型訓練方法,允許利用通用概率路徑監督CNF訓練過程。尤為重要的是,FM打破了擴散模型之外的CNF可擴展訓練障礙,無需深入理解擴散過程即可直接操作概率路徑,從而繞過了傳統訓練中的難題。

所謂CNF,就是Continuous Normalizing Flows,連續歸一化流。這是一種深度學習中的概率模型和生成模型技術。在CNF中,通過一系列可逆且連續的變換將簡單的概率分布轉換為復雜的、高維數據的概率分布。這些變換通常由一個神經網絡來參數化,使得原始隨機變量經過連續變換后能夠模擬目標數據分布。翻譯成大白話,CNF像是搖骰子那樣生成數據的。

Stable diffusion 3生成

但是CNF在實際操作中需要大量的計算資源和時間,于是Stable AI就尋思了,那能不能又一個結果只要差不多和CNF一樣就行,但是流程要穩定,計算量要低的方法?于是FM就誕生了,FM的本質是一個用于訓練CNF模型以適應并模擬給定數據分布演化過程的技術,即使我們并不事先知道這個分布的具體數學表達式或對應的生成向量場。通過優化FM目標函數,也可以逐步讓模型學習到能夠生成與真實數據分布近似的概率分布的向量場。

相較于CNF而言,FM應該算是一種優化方法,它的目標是訓練CNF模型生成的向量場與理想的目標概率路徑上的向量場盡可能接近。

Stable diffusion 3生成

看完了Stable Diffusion 3的兩大核心技術特性你就會發現,其實它和Sora非常接近。倆模型都是transformer模型(stable diffusion此前采用的是U-Net)、都使用塊、都有著劃時代的穩定性和優化,而且出生日期還這么近,說他們有血緣關系,我認為并不過分。

不過“兄弟倆”有一個根源性的不同,那就是Sora閉源,Stable Diffusion 3開源。事實上,Midjourney也好,DALL·E也好,他們都是閉源的,唯有Stable Diffusion是開源的。如果你關注開源人工智能,那么你一定發現了,開源社區陷入困境已經有很長一段時間了,沒有明顯的突破,很多人都對此失去信心。Stable Diffusion 2和Stable Diffusion XL僅改進了生成圖片的美觀性,而Stable Diffusion 1.5已經可以做到這一點。看到Stable Diffusion 3的革命性改進,能讓很多人開源社區的開發者重燃信心。

Stable diffusion 3生成

再說個刺激的,Stable AI的CEO默罕默德艾馬德莫斯塔克(??????? ???? ??????)在推特中說到,盡管Stable AI在人工智能這個領域的資源比其他一些公司少了足足100倍,但是Stable Diffusion 3架構已經可以接受除了視頻和圖像以外的內容了,不過目前還不能公布太多。

你說圖片和視頻我還能理解,可啥叫“以外”的內容?其實我能想到的那就是音頻了,通過一段聲音來生成圖片。讓人摸不著頭腦,不過一旦Stable AI放出最新的研究成果,我們一定第一時間拿來解讀。

Stable diffusion 3生成

熱門
亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app
  • <strike id="ykeqq"><input id="ykeqq"></input></strike>
  • <strike id="ykeqq"><menu id="ykeqq"></menu></strike>
    <strike id="ykeqq"></strike>
    <fieldset id="ykeqq"></fieldset>
    <del id="ykeqq"><dfn id="ykeqq"></dfn></del>
    麻豆av一区二区三区久久| 欧美精品麻豆| 欧美成人蜜桃| 国产精品盗摄久久久| 欲色影视综合吧| 狂野欧美性猛交xxxx巴西| 国产精品黄视频| 在线日本成人| 麻豆成人在线观看| 国产精品综合av一区二区国产馆| 亚洲在线观看免费视频| 欧美高清视频免费观看| 国产一区二区三区精品欧美日韩一区二区三区 | 亚洲视频综合| 麻豆av一区二区三区久久| 国产精品日本欧美一区二区三区| 亚洲综合日韩中文字幕v在线| 欧美国产日韩精品免费观看| 国模叶桐国产精品一区| 久久理论片午夜琪琪电影网| 国产精品一区二区女厕厕| 性久久久久久| 国产精品久久一级| 欧美中文字幕视频| 国产精品丝袜白浆摸在线| 欧美在线观看www| 国产精品日韩在线| 久久国产精品久久精品国产| 国产精品免费一区二区三区在线观看| 午夜精品久久久久99热蜜桃导演| 欧美视频二区36p| 午夜精品偷拍| 国产精品男女猛烈高潮激情| 久久都是精品| 国产一区二区黄色| 欧美a一区二区| 亚洲视频一区二区免费在线观看| 欧美激情免费观看| 亚洲午夜影视影院在线观看| 欧美日韩国产va另类| 亚洲欧美日韩精品久久| 国产精品美女xx| 久久久天天操| 在线观看国产成人av片| 欧美日韩国产三级| 久久se精品一区二区| 国产偷久久久精品专区| 欧美成人激情在线| 亚洲一区中文| 国产欧美精品日韩精品| 免费视频最近日韩| 亚洲无线视频| 国产精品激情电影| 麻豆成人在线播放| 亚洲制服少妇| 国产日韩一区欧美| 欧美精选一区| 久久精品一区二区| 永久免费毛片在线播放不卡| 欧美日韩理论| 久久久久久成人| 在线成人小视频| 国产精品欧美在线| 欧美ab在线视频| 性欧美xxxx大乳国产app| 国产日韩一区二区三区在线| 欧美成人午夜剧场免费观看| 亚洲欧美日韩另类| 国产亚洲精品久| 欧美日韩一区二区三区| 久久久久国产精品一区| 精品动漫av| 国产精品网红福利| 欧美好骚综合网| 久久精品国产亚洲a| 在线不卡免费欧美| 国产精品免费福利| 欧美绝品在线观看成人午夜影视| 欧美主播一区二区三区| 影音先锋在线一区| 国产精品揄拍一区二区| 欧美日韩国产欧| 免费欧美在线视频| 欧美一区视频在线| 在线综合亚洲| 黑人巨大精品欧美一区二区| 欧美午夜精品久久久久久久| 免费观看在线综合色| 久久精品官网| 西瓜成人精品人成网站| 狠狠色综合网| 国产区亚洲区欧美区| 欧美日韩一区二区高清| 欧美成人资源| 久久免费国产精品| 小处雏高清一区二区三区| 精品电影一区| 国内一区二区在线视频观看| 国产毛片一区二区| 国产精品久久网站| 欧美日韩午夜在线视频| 欧美成人综合在线| 久久亚洲色图| 久久人91精品久久久久久不卡| 亚洲欧美日韩网| 中文日韩电影网站| 韩国精品一区二区三区| 国产精品一区二区三区四区| 欧美视频网站| 欧美精品在线网站| 欧美精品麻豆| 欧美精品18videos性欧美| 欧美电影电视剧在线观看| 久久影视三级福利片| 久久久精品2019中文字幕神马| 午夜精品成人在线视频| 亚洲免费网址| 亚洲欧美日韩另类| 亚洲在线免费| 亚洲一区久久久| 亚洲欧美激情视频| 亚洲欧美日韩综合| 亚洲欧美综合v| 午夜伦欧美伦电影理论片| 亚洲欧美另类中文字幕| 亚洲欧美日韩区| 午夜日韩在线观看| 欧美在线黄色| 久久九九热免费视频| 久久久久久久精| 久久综合色8888| 欧美成人一区二区在线 | 久久精品成人一区二区三区蜜臀 | 国产精品国内视频| 国产精品国产成人国产三级| 国产精品国产自产拍高清av王其| 国产精品久久久久久久久久久久| 国产精品劲爆视频| 国产精品自拍视频| 国产视频在线观看一区 | 国产一区二区三区精品欧美日韩一区二区三区| 国产精品一区二区久久精品| 国产人成精品一区二区三| 国产在线精品二区| 在线综合亚洲欧美在线视频| 亚洲综合99| 欧美在线www| 可以看av的网站久久看| 欧美刺激午夜性久久久久久久| 欧美日本高清一区| 国产精品萝li| 韩日在线一区| 亚洲女性裸体视频| 久久久久se| 欧美女人交a| 国产酒店精品激情| 激情久久久久久| 午夜欧美大尺度福利影院在线看| 久久久.com| 欧美久久久久久久久| 国产精品婷婷午夜在线观看| 国内精品视频在线观看| 亚洲视频在线观看网站| 欧美在线视频观看免费网站| 老司机精品视频网站| 欧美日本中文字幕| 国产区在线观看成人精品| 亚洲素人在线| 久久午夜电影网| 欧美视频一区二区在线观看| 国产日韩欧美在线播放不卡| 亚洲一区二区三区高清| 久久久久久久久久久久久久一区 | 黄色国产精品一区二区三区| 亚洲免费视频一区二区| 久久先锋影音| 欧美偷拍一区二区| 精品二区视频| 久久精品国产精品亚洲精品| 欧美国产亚洲视频| 国产伦精品一区二区三区高清| 正在播放亚洲| 老司机一区二区| 国产精品成人一区二区| 在线看片欧美| 久久中文字幕导航| 国产精品免费在线| 亚洲影院色在线观看免费| 麻豆精品视频在线观看视频| 国产精品国产a级| 亚洲一区二区三区777| 免费看的黄色欧美网站| 国产精品视频免费在线观看| 亚洲视频在线视频| 免费中文日韩| 国产偷久久久精品专区| 久久国产精品99久久久久久老狼| 欧美日韩精品免费观看视一区二区 | 精品成人一区二区三区| 久久琪琪电影院|