天天看點

内測申請開啟!同花順問财大模型—HithinkGPT來了!

作者:證券市場周刊市場号

作為A股市場“網際網路+金融+AI”第一股,同花順憑借十餘年的人工智能技術積累,再度創新,推出了問财HithinkGPT大模型。此款大模型采用transformer的decoder-only架構,提供7B、13B、30B、70B和130B五種版本選擇,最大允許32k文本輸入,支援API接口調用、網頁嵌入、共建、私有化部署等能力,并為使用者提供一站式标注和評測服務

。現在,問财HithinkGPT大模型的内測申請已經啟動,我們真誠地邀請您成為首批内測使用者,共同探索AI技術的無限可能。掃描或長按下方二維碼即可申請内測。

(長按二維碼報名)

1.凝練技術-成就HithinkGPT

HithinkGPT大模型彙聚了同花順多年的技術精髓與資料優勢,緻力于通過AI技術提升使用者和合作夥伴的使用體驗,讓投資變得更加簡單。HithinkGPT在多個場景中有出色的表現,在金融領域中處于絕對領先的位置:

通用領域:HithinkGPT大模型在C-Eval、GSM8K、MMLU、MATH

等10多個主流Benchmark測評集上的表現全面超越了主流開源模型Llama-2。

内測申請開啟!同花順問财大模型—HithinkGPT來了!

金融領域:同花順自建了HithinkFinEval資料集,涵蓋了證券從業考試、基金從業考試、會計師資格考試、CPA、CFA等17個金融行業考試。在這些考試中,問财HithinkGPT-70B大模型以平均75.9分的優異成績通過考試,并且HithinkGPT在所有考試科目中都比開源模型更加優秀。

内測申請開啟!同花順問财大模型—HithinkGPT來了!

以上成果離不開同花順獨特的金融領域資料優勢與長期以來的AI全面技術研發投入,我們針對大模型訓練與推理做到了極緻的優化與技術探索,包括資料覆寫、模型訓練、高效推理以及智能安全:

1、金融資料的全面覆寫:同花順利用自身過去十幾年的資料積累以及市場上公開的金融資料,預訓練金融語料達到萬億級tokens。此外,我們擁有一套自動化的流程,用于資料擷取、清洗以及資料品質的驗證,每月可新增數千億tokens優質預訓練資料以及數十萬條優質微調資料,確定資料的實時性和準确性。

2、模型訓練的創新優化:我們建構了科學高效的大模型訓練體系,包括:資料配比實驗方案、scaling law實驗體系、模型架構優化、分布式訓練架構優化、硬體加速技術等。使得我們的大模型訓練效率提升了數倍,能以更低的訓練成本高效地完成HithinkGPT大模型家族(7B、13B、30B、70B和130B)的訓練。

3、AI算力的極緻使用:同花順建構了千卡異構叢集,為模型訓練提供支援。推理上,我們通過應用無損自适應選層剪枝、通信及底層算子優化,以及實作多資料中心負載均衡,使模型推理吞吐速度提高八倍以上。此外,我們自主研發了大模型量化算法,量化後的模型精度損失小于1%,同時部署顯存需求減半,推理的吞吐量進一步提高了兩倍以上。

4、智能安全的堅決守護:我們使用輕量高效的RLHF方案,将大模型對安全的認知與人類拉齊。同時,我們獨創更新檔式大模型熱修複技術,快速應對并封堵安全漏洞,不斷提高模型的安全性。我們旨在建構有用、無害、三觀正确的智能夥伴,確定每一位使用者都能安心使用。

2.全面更新-全能金融顧問:問财

原來就廣受投資者喜愛的投顧對話機器人:同花順問财,現基于HithinkGPT成功更新,是國内金融領域首個應用大模型技術的智能投顧産品。

大模型版本的問财涵蓋A股、基金、ETF、港股、美股、債券、宏觀等15個業務矩陣,包括七大投資環節的查詢、分析、對比、解讀、原因、預測、建議、回測等在内的50餘類技能,為使用者提供全面精準、穩定可控的投資決策支援。

大模型版本的問财與傳統模式的問财相比,具有以下五大特色優勢:全面的實時金融資料、強大的語義了解、專業的投顧建議、生動的表達形式、可控的内容生成,緻力于成為使用者的全能金融顧問:

  1. 更全面的實時資料:問财大模型可以實時擷取全球數百萬個實時更新的金融資料名額以及每天産生的數十萬條金融相關資訊。這些資料涵蓋了股票、債券、期貨、外彙、商品價格、宏觀經濟名額、行業資料等各個方面,確定使用者始終能夠擷取到最新、最全的資訊。
  2. 更強大的語義了解 :問财在十多年前就已經涉足金融人機互動領域,積累了數十億條完整、專業、高品質的結構化金融資料,其對語義了解以及使用者個性化了解能力的提升具有先天優勢;同時每天持續産生數千萬條金融資料,結合大模型自我進化能力,使得大模型能夠更準确的了解使用者意圖和需求。
  3. 更專業的投顧建議:圍繞使用者的投資目标,基于“使用者的五大KYC标簽體系、投資分析的六大次元、以及投資過程的七大步驟”,模拟了真人投顧服務邏輯,給使用者最科學合理的投資建議,讓投資變得更簡單。
  4. 更生動的表達形式:同花順問财大模型已經打破了行業常用的文本格式限制,截至目前,我們已經擁有動态折線圖、動态雙柱圖等14種資料可視化元件以及圖檔生成和視訊生成兩種富媒體可視化工具,并支援使用者自定義,覆寫了投顧建議、宏觀、資訊、投教等15大核心業務領域,利用多模态技術讓資訊傳遞更高效更人性。

    5、更可控的内容生成:安全性上通過内置的智能風險識别系統,能夠實時監測和召回5大類31種潛在風險的提問意圖,通過系統對抗性訓練和魯棒性評估,風險召回率超過99.5%,同時邀請業界知名的安全機構和專家,對産品進行了全面的安全測試和評估,獲得了高度的認可!

來源:同花順

免責聲明:本文為轉載内容,不代表本刊立場,亦不構成投資建議。

繼續閱讀