斯坦福研究發現GPT-4“變笨”；美團再次出手大模型

圖靈周報：精選AI行業一周大事件，從良莠不齊的行業資訊中挑選出最有價值的資訊，配上專業點評，值得你細讀、品味

01斯坦福研究證明GPT-4變笨了

圖源：arxiv論文截圖

來自斯坦福、UC Berkeley 的一項研究比較了六月份和三月份的GPT-4版本在解決數學問題和生成代碼等任務時的表現，結果顯示準确率急劇下降，解決數學問題的成功率從97.6%降到了2.4%，生成代碼的成功率從52%降到了10%。

點評：近期有不少使用者抱怨GPT-4的回答品質大幅下降，這份最新研究為這些抱怨提供了資料依據。而OpenAI也承認：GPT-4确實在某些任務上的性能變差了。

02Meta推出首個開源大模型商業版本

圖源：unsplash

7月18日，Facebook母公司Meta在其官網上宣布開源下一代AI大語言模型 Llama 2，并将其技術免費用于研究和商業用途。即日起，人們可以直接下載下傳 Llama 2的模型系列（包括 Llama 2 和 Llama 2-Chat），也可以通過微軟雲平台 Azure、亞馬遜網絡服務（AWS）和 Hugging Face 等平台使用。

點評：Llama 2将通過微軟雲Azure分發，并将在Windows作業系統上運作。微軟是OpenAI的最大支援者，并一直緻力于在Azure中提供OpenAI技術。一邊是一馬當先的OpenAI的支援者，另一邊是積極探索商用的合作方。在這波的人工智能浪潮中，微軟應該算是絕對的赢家了。

03美國科技巨頭承諾為人工智能生成内容“打水印”

圖源：Pexels

當地時間21号，美國白宮釋出公告稱，已與大型科技公司達成協定，将為人工智能的開發設定更多“護欄”，包括開發水印系統等，以防範虛假資訊的傳播和其他風險。這些公司還承諾，随着人工智能技術的發展，它們将重點保護使用者隐私，并確定該技術不帶偏見，不會被用于歧視弱勢群體。

點評：伴随着ChatGPT的爆火，AI安全和隐私保護也逐漸引發關注。不論是美國、中國，還是歐洲，在這一次由ChatGPT所引發的人工智能技術面前，都在快速的思考與響應，借助于立法來規範與確定這項技術能夠更好的服務于人類社會。

04“科學探索獎”2023年獲獎名單公布

圖源：科學探索獎公衆号

7月17日，第五屆“科學探索獎”獲獎名單正式揭曉，48位青年科學家榜上有名。“科學探索獎”面向基礎科學和前沿技術十個領域，支援在中國内地及港澳地區全職工作、45周歲及以下的傑出青年科學家，每位獲獎人将在5年内獲得總計300萬元人民币獎金，并且可以自由支配獎金的使用。

點評：随着新一屆獲獎名單揭曉，“科學探索獎”5年共資助248位青年科學家。“科學探索獎”設立于2018年。由楊振甯、饒毅、施一公、潘建偉、謝曉亮等14位知名科學家，與騰訊基金會發起人馬化騰共同發起。這是一項由新基石科學基金會出資、科學家主導的公益獎項，也是目前國内金額最高的青年科技人才資助項目之一。獎項秉持“面向未來、獎勵潛力、鼓勵探索”的宗旨，鼓勵青年科技人才探索科學“無人區”，探索社會支援基礎研究人才持續穩定的投入機制。

05美團入股大模型公司智譜AI

圖源：美團

天眼查App顯示，近日，中文認知大模型平台智譜AI關聯公司北京智譜華章科技有限公司發生工商變更，股東新增美團旗下天津三快科技有限公司，注冊資本由約1480.69萬人民币增至約1652.86萬人民币。

點評：這也是近期少有的一筆數額破億美金的融資。此前拿到融資的AI創業公司，數額大都在百億、千億美金級别，能夠拿出自研模型的幾家距離億元俱樂部仍有一步之遙。能拿到上億美金的創業公司，需要兼具頂級團隊和自研大模型的技術，且有成功的落地經驗——而這樣的公司，國内目前一隻手都數得過來。牽手智譜，美團則是給自己找到了一個技術和業務更為成熟的盟友。

06微軟清華提出媲美Transformer的新架構

圖源:論文截圖

來自微軟研究院、清華大學的研究人員7月17日發表一篇論文，提出retentive網絡（RetNet）。RetNet同時實作了低成本推理、高效長序列模組化、媲美Transformer的性能和并行模型訓練，打破了“不可能三角”。

點評：RetNet的推理延遲對批大小不敏感，進而實作了巨大的吞吐量。不少研究者驚呼“好得不可思議”，甚至有人将其比作“M1晶片”登場時的變革意義。也有研究者提出疑問：這麼優秀的表現是否意味着RetNet要在某些方面有所權衡，以及它能否擴充到視覺領域。

斯坦福研究發現GPT-4“變笨”；美團再次出手大模型 | 圖靈周報