制藥業中的自然語言處理（NLP）

自然語言處理（NLP）在制藥業的使用似乎少于機器視覺和預測分析等AI方法，但盡管如此，NLP在制藥業仍有一些應用。該行業主要處理結構化資料，但是在某些業務領域中，非結構化資料是常态。在本文中，我們讨論了自然語言處理如何幫助制藥公司了解其非結構化資料并使用其進行決策。

制藥公司可能擁有各種數字格式的類型化、非結構化資料，這些資料可用于确定患者參加臨床試驗的資格。最常見的格式如下：

醫師筆記

病理報告

操作說明

電子病曆（EMR）資料

NLP用于發現新藥物化合物

藥物發現（Drug Discovery）是許多軟體供應商提供解決方案的業務領域，但是其中大多數聲稱涵蓋藥物化合物的大資料分析或分子成像。但是，NLP解決方案與該領域的其他應用程式沒有很多用例。

相反，該技術更适合于檢測非結構化資料中的資訊，這可能有助于藥物發現過程。包括從以前的研究文檔中提取資訊，以查找注釋過去的化學實驗結果。

例如，制藥公司的科學家可以使用NLP工具查找以前發現的化學反應，并發現它們不需要進行給定的實驗，因為結果是已知的。然後，科學家可以利用所有相關知識重新評估進一步的實驗。

公司過去測試某些藥物或分子的經驗被儲存為實驗記錄資料或臨床試驗資料。這些檔案通常由人使用帶有藥學術語的通用語言編寫。開發人員需要在這些文檔的标記版本上訓練機器學習模型，以便它可以“學習”以識别單個表單上各個字段之間的差異。可以在多種類型的表單以及來自每個字段或表單的資訊類型上訓練單個模型。通常在臨床試驗和定期的就診中報告藥物的不良反應。是以，需要在臨床試驗報告和EMR資料上訓練機器學習模型，以便從中識别資訊。

NLP用于将參與者納入臨床試驗

臨床試驗比對是制藥業NLP的另一個用例。從醫生的筆記和以往的試驗中找到合适的患者進行臨床試驗是很費時的，但是可以使用在這些類型的文檔上受過訓練的AI軟體自動進行。AI供應商提供的常見解決方案是NLP程式，可以從擴充的患者檔案清單或資料庫中識别出最适合給定試驗的患者。

除了要完成臨床醫生團隊所需的時間外，将患者比對到适當的臨床試驗對制藥公司也構成了一些關鍵問題。

檢測和識别疾病和傷害的國際疾病分類（ICD-10）代碼

從各種非結構化資料源中提取重要資料點

在保持患者隐私并隐藏受保護資訊的同時利用患者資料

ICD-10代碼對于确定患者的臨床試驗生存能力至關重要。這些規範幾乎标準化了患者過去可能遭受或曾經遭受的所有可能的疾病或傷害。需要對用于臨床試驗比對的機器學習模型進行訓練，以識别ICD-10代碼或與患者相關的代碼，并确定其是否與所測試的藥物密切相關。

從這些格式中識别資訊将需要對機器學習模型進行訓練，以對在相同類型文檔中找到的藥物資料進行訓練。開發人員不僅需要運作每個ICD-10代碼，還需要标記每種類型的文檔中的每個特定字段，并通過該模型運作成千上萬的報告。這将使生成的軟體能夠檢測哪些字段包含哪些類型的資訊，以及文檔可能引用的任何疾病的分類。

某些患者資料可能受到法律或協定的保護，無法将資訊連結回個人的方式洩露。并不是很多供應商提供可以專門處理此類情況的解決方案，但是有些供應商聲稱能夠在保護隐私的同時混淆資訊，同時仍能提供有用的見解。對于沒有詳細介紹特定患者或醫生但包含相關統計資訊的圖形或其他可視化效果，這可能是可能的。

藥品營銷的NLP

在非結構化的客戶資料中仍然可以找到許多營銷和銷售機會。随之而來的是，NLP仍然有可能解決藥品的市場或銷售問題。

NLP軟體解決方案可以解決制藥公司的營銷或銷售團隊的最常見業務問題是：

評估圍繞産品的社交媒體嗡嗡聲，并确定各個文章的情緒

利用客戶或患者檔案資料來查找個人或人口統計中的機會價值

從銷售電話記錄中分析呼叫中心數

分析社交媒體文章的情緒和特定藥品的關聯，将要求訓練機器學習模型的人将與産品關聯的各種單詞，短語以及可能的網際網路語标記為肯定或否定。一些句子片段也可以被标記以允許上下文的更具體的解釋。

這将允許公司将對廣告或産品的社交媒體響應彙總為單個資料點，可以對這些資料進行評估以評估營銷活動的績效。

客戶和患者資訊可以包括來自CRM的資料、匿名電子病曆（EMR）資料或基于其先前購買的交易資料。NLP軟體可以利用廣告、藥品或其他産品來檢測患者或客戶的病史，并将其與人群中其他患者的經曆進行彙總。通過向客戶團隊展示未來哪些區域可能需要更好的政策，可以對營銷活動産生積極影響。

銷售電話中心資料很可能存儲為銷售電話的音頻記錄，可以通過語音識别軟體進行處理和識别。NLP的此應用在建立EMR和其他數字轉錄的醫療文檔中有很多用途，但是在這裡它可用于識别客戶參與度以及銷售代表對銷售協定的遵守情況。

AI語音識别軟體需要使用各種曲率和各種背景噪聲，在盡可能多的不同聲音上進行訓練。這樣，當銷售代表與客戶打交道時，如果出現任何幹擾，模型可以更輕松地識别通話中所說的話。重要的是要注意，與其他行業相比，藥品的營銷和銷售解決方案将需要更徹底的資料标記和準備過程。這是因為需要針對制藥業的機器學習模型對單獨的醫學和制藥短語和代碼進行訓練，而其他行業卻沒有。

制藥業中的自然語言處理（NLP）

繼續閱讀

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

無人機--飛控科普

neo4j之cypher使用文檔

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

SequoiaDB巨杉資料庫C++驅動概述