天天看點

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

作者:IT咖啡館

GitHub 一周熱點彙總第10期(2024/02/11-02/17) ,梳理每周熱門的GitHub項目,了解熱點技術趨勢,來看看這周的熱門項目。

#1 MoneyPrinter

  • 項目名稱:MoneyPrinter - 自動生成 youtube 短片
  • GitHub 連結:https://github.com/FujiwaraChoki/MoneyPrinter
  • 上周 Star 數:5300
GitHub 一周熱點彙總第10期(2024/02/11-02/17)

這個項目的名字真是太直白了 MoneyPrinter ,本項目是利用多種AI工具來最終實作輸入期望的文本,自動輸出視訊短片的效果。

作者的想法非常的直白和落地,就是通過python将一些現有的技術進行整合,最終實作一個可用的效果。其實項目的内容非常簡單直白,核心隻有幾個python檔案。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

來說說作者的實作思路,很值得大家借鑒。

  • 使用GPT來寫視訊腳本
  • 使用pexels的API來搜尋相關的視訊
  • 用TikTok-Voice-TTS 來做語音生成
  • 使用moviepy來剪切和增加字幕
  • 最後還可以通過Google API來上傳youtube

怎麼樣,看起來似乎很簡單,很多事情都是一樣,做了就不難。

下面是它的GitHub star,看來外國的友人們也很喜歡項目的實操精神。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

#2 pkl

  • 項目名稱:pkl - 配置即代碼語言
  • GitHub 連結:https://github.com/apple/pkl
  • 上周 Star 數:4000+

這是一個蘋果的開源項目,Pkl(發音為Pickle  )是一種配置即代碼語言,具有豐富的驗證和工具。它可以用作指令行工具、軟體庫或建構插件。Pkl 的規模可以從小到大、從簡單到複雜、從臨時配置任務到重複配置任務。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

建立 Pkl 是因為他們相信配置最好用專用配置語言來表達;靜态配置格式和通用程式設計語言的混合。

目前的使用場景主要包括生成靜态配置和應用程式運作時配置*。*目前主持的語言包括了Java,Kotlin,Swift和go

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

Pkl支援輸出的格式包括如下:

  • JSON
  • Jsonnet
  • Pcf (a static subset of Pkl)
  • (Java) Properties
  • Property List
  • XML
  • YAML

并且 Pkl 為配置内容提供更好的驗證支援,以便在部署前發現内容的錯誤。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

#3 StableCascade

  • 項目名稱:StableCascade - 文生圖模型
  • GitHub 連結:https://github.com/Stability-AI/StableCascade
  • 上周 Star 數:3400+
GitHub 一周熱點彙總第10期(2024/02/11-02/17)

Stable Cascade 是由 StabilityAI釋出了新的一代文生圖模型,Stable Cascade是基于Wuerstchen架構包含三階段的文生圖擴散模型,相比Stable Diffusion XL,它不僅更快而且效果更好。

本項目是Stable Cascade的官方代碼庫。我們提供訓練和推理腳本,以及可以使用的各種不同模型。

Stable Cascade 在視覺和評估方面都取得了令人印象深刻的結果。根據我們的評估,在幾乎所有比較中,Stable Cascade 在快速對齊和美觀品質方面都表現最好。上圖顯示了使用部分提示(連結)和審美提示相結合的人類評估結果。具體來說,将 Stable Cascade(30 個推理步驟)與 Playground v2(50 個推理步驟)、SDXL(50 個推理步驟)、SDXL Turbo(1 個推理步驟)和 Würstchen v2(30 個推理步驟)進行了比較。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

Stable Cascade 對效率的關注通過其架構和更高壓縮的潛在空間得到了證明。盡管最大的模型比 Stable Diffusion XL 多包含 14 億個參數,但它仍然具有更快的推理時間,如下圖所示。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

Stable Cascade由三個模型組成:Stage A、Stage B和Stage C,代表生成圖像的級聯,是以得名“Stable Cascade”。A 階段和 B 階段用于壓縮圖像,類似于穩定擴散中 VAE 的工作。然而,如前所述,通過此設定可以實作更高的圖像壓縮。此外,階段 C 負責在給定文本提示的情況下生成小的 24 x 24 潛伏。下圖直覺地展示了這一點。請注意,階段 A 是 VAE,階段 B 和 C 都是擴散模型。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

#4 ml-mgie

  • 項目名稱:ml-mgie - 圖像編輯模型
  • GitHub 連結:https://github.com/apple/ml-mgie
  • 上周 Star 數:1700+

本項目是由蘋果推出的一款開源人工智能模型 ,能夠基于多模态大語言模型(multimodal large language models,MLLM)來解釋使用者指令,并處理各種編輯場景的像素級操作,比如,全局照片優化、本地編輯、Photoshop 風格的修改等。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

Apple ML-MGIE 的主要特性

  • 視覺感覺響應生成。ML-MGIE 可以通過語言模型生成對視覺内容的響應,這意味着它可以了解圖像内容并生成相關的文本描述或回答與圖像相關的問題。此功能在提供圖像描述、增強現實應用和視覺資料分析方面特别有用。
  • 跨模式了解。ML-MGIE 在跨模态了解方面表現出強大的能力,可以連結不同模态(例如文本和圖像)的資訊以實作全面了解。例如,它可以通過分析圖像内容和相關文本描述來增強場景了解。這種跨模式了解對于改善人機互動、增強搜尋引擎結果和建立更智能的教育工具至關重要。
  • 圖像編輯指南。ML-MGIE 的一個重要應用是指導基于指令的圖像編輯。它可以根據使用者指令編輯圖像,例如更改圖像中對象的顔色、形狀或大小。這是通過将多模态大語言模型與擴散模型內建來實作的,其中 ML-MGIE 與 InstructPix2Pix 等技術相比顯示出卓越的性能。該能力可應用于自動化圖像編輯工具,提高圖像編輯的效率和準确性。
GitHub 一周熱點彙總第10期(2024/02/11-02/17)

#5 free-for-dev

  • 項目名稱:free-for-dev - 免費開發工具集
  • GitHub 連結:https://github.com/ripienaar/free-for-dev
  • 上周 Star 數:1300 +

本項目整理了一個針對開發者提供免費套餐的服務集合,包含SaaS、PaaS、IaaS 等多個方面,幫助開發者可以快速的找到自己需要的資源。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

因為免費的開發資源範圍很廣,項目保持專注性,主要針對的人群是基礎設施開發人員(系統管理者、DevOps 從業人員等),這類使用者可以更好在本項目中發現價值。以下是一部分的目錄,内容還是很多的。

GitHub 一周熱點彙總第10期(2024/02/11-02/17)

這裡也要提醒國内的開發者一句,這個項目包括的内容主要還是針對海外,如果你做出海業務應該非常适合,如果你是完全的國内開發,需要更加仔細的篩選合适自己的内容。