天天看點

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

作者:思想開放的湖泊 n
圖靈周報:精選AI行業一周大事件,從良莠不齊的行業資訊中挑選出最有價值的資訊,配上專業點評,值得你細讀、品味

01斯坦福研究證明GPT-4變笨了

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

圖源:arxiv論文截圖

來自斯坦福、UC Berkeley 的一項研究比較了六月份和三月份的GPT-4版本在解決數學問題和生成代碼等任務時的表現,結果顯示準确率急劇下降,解決數學問題的成功率從97.6%降到了2.4%,生成代碼的成功率從52%降到了10%。

點評:近期有不少使用者抱怨GPT-4的回答品質大幅下降,這份最新研究為這些抱怨提供了資料依據。而OpenAI也承認:GPT-4确實在某些任務上的性能變差了。

02Meta推出首個開源大模型商業版本

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

圖源:unsplash

7月18日,Facebook母公司Meta在其官網上宣布開源下一代AI大語言模型 Llama 2,并将其技術免費用于研究和商業用途。即日起,人們可以直接下載下傳 Llama 2的模型系列(包括 Llama 2 和 Llama 2-Chat),也可以通過微軟雲平台 Azure、亞馬遜網絡服務(AWS)和 Hugging Face 等平台使用。

點評:Llama 2将通過微軟雲Azure分發,并将在Windows作業系統上運作。微軟是OpenAI的最大支援者,并一直緻力于在Azure中提供OpenAI技術。一邊是一馬當先的OpenAI的支援者,另一邊是積極探索商用的合作方。在這波的人工智能浪潮中,微軟應該算是絕對的赢家了。

03美國科技巨頭承諾為人工智能生成内容“打水印”

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

圖源:Pexels

當地時間21号,美國白宮釋出公告稱,已與大型科技公司達成協定,将為人工智能的開發設定更多“護欄”,包括開發水印系統等,以防範虛假資訊的傳播和其他風險。這些公司還承諾,随着人工智能技術的發展,它們将重點保護使用者隐私,并確定該技術不帶偏見,不會被用于歧視弱勢群體。

點評:伴随着ChatGPT的爆火,AI安全和隐私保護也逐漸引發關注。不論是美國、中國,還是歐洲,在這一次由ChatGPT所引發的人工智能技術面前,都在快速的思考與響應,借助于立法來規範與確定這項技術能夠更好的服務于人類社會。

04“科學探索獎”2023年獲獎名單公布

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

圖源:科學探索獎公衆号

7月17日,第五屆“科學探索獎”獲獎名單正式揭曉,48位青年科學家榜上有名。“科學探索獎”面向基礎科學和前沿技術十個領域,支援在中國内地及港澳地區全職工作、45周歲及以下的傑出青年科學家,每位獲獎人将在5年内獲得總計300萬元人民币獎金,并且可以自由支配獎金的使用。

點評:随着新一屆獲獎名單揭曉,“科學探索獎”5年共資助248位青年科學家。“科學探索獎”設立于2018年。由楊振甯、饒毅、施一公、潘建偉、謝曉亮等14位知名科學家,與騰訊基金會發起人馬化騰共同發起。這是一項由新基石科學基金會出資、科學家主導的公益獎項,也是目前國内金額最高的青年科技人才資助項目之一。獎項秉持“面向未來、獎勵潛力、鼓勵探索”的宗旨,鼓勵青年科技人才探索科學“無人區”,探索社會支援基礎研究人才持續穩定的投入機制。

05美團入股大模型公司智譜AI

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

圖源:美團

天眼查App顯示,近日,中文認知大模型平台智譜AI關聯公司北京智譜華章科技有限公司發生工商變更,股東新增美團旗下天津三快科技有限公司,注冊資本由約1480.69萬人民币增至約1652.86萬人民币。

點評:這也是近期少有的一筆數額破億美金的融資。此前拿到融資的AI創業公司,數額大都在百億、千億美金級别,能夠拿出自研模型的幾家距離億元俱樂部仍有一步之遙。能拿到上億美金的創業公司,需要兼具頂級團隊和自研大模型的技術,且有成功的落地經驗——而這樣的公司,國内目前一隻手都數得過來。牽手智譜,美團則是給自己找到了一個技術和業務更為成熟的盟友。

06微軟清華提出媲美Transformer的新架構

斯坦福研究發現GPT-4“變笨”;美團再次出手大模型 | 圖靈周報

圖源:論文截圖

來自微軟研究院、清華大學的研究人員7月17日發表一篇論文,提出retentive網絡(RetNet)。RetNet同時實作了低成本推理、高效長序列模組化、媲美Transformer的性能和并行模型訓練,打破了“不可能三角”。

點評:RetNet的推理延遲對批大小不敏感,進而實作了巨大的吞吐量。不少研究者驚呼“好得不可思議”,甚至有人将其比作“M1晶片”登場時的變革意義。也有研究者提出疑問:這麼優秀的表現是否意味着RetNet要在某些方面有所權衡,以及它能否擴充到視覺領域。