天天看點

藥物開發的社交圖譜Social Graphs for Drug Development

Social Graphs for Drug Development

通過提供更好的清晰度和對異構資料集的通路,建構社交圖譜(知識圖譜)以改善臨床試驗的流程并降低成本。

藥物開發的社交圖譜Social Graphs for Drug Development

The Valley of Death

阿斯利康的健康資訊學總監Paul Agapow在Grakn Labs的第一次全球使用者大會Grakn Cosmos上講述了他的團隊在建構社交圖譜以減少臨床試驗招募時的時間和減少資源的工作。

藥物開發是一個非常困難,曠日持久且昂貴的過程。當一家制藥公司開始生産一種新藥時,它已經通過了臨床試驗的所有階段。許多制藥公司都在内部存儲了藥物蛋白質互相作用集,即能夠與人體某些部分互相作用的成千上萬個候選分子。這是許多藥物開發項目的起點。然後根據可行的方法和合理的方法對它們進行縮減。甚至在将藥物放入人體之前,可能最終會得到250個候選分子左右。

從這250個候選分子進入臨床試驗的第1階段(在其中檢查安全性和有效性)中,可能會減少到5,然後再進行法規審查;最後,您将獲得一種新藥。

藥物開發的社交圖譜Social Graphs for Drug Development

1. 臨床試驗過程的簡要概述

階段1:研究對少量患者給藥時藥物的安全性。通常在第1階段的試驗中包含10個人。

階段2:重新評估安全性-對人類安全嗎?并着眼于預期的治療效果。第2階段中,該藥物針對100例患者進行了測試。

階段3:最終的安全性和功效檢查-這種藥物會意外殺死您并且對您有好處嗎-并問這是否比目前生産的藥物做得更好?

大量受試者可以使臨床試驗受益。一般來說,受試者越多,統計能力越強。但是,由于每個受試者的費用在10,000美元至60%的臨床試驗中均無法達到其招募目标,是以這是該過程中比較艱巨的方面之。

2. 招募工作如何進行?

傳統上,招募是通過社會方式來完成的:個人聯系,小冊子,招募站點,醫院周圍的廣告等。如今,這與增加的招募目标和正在投放的藥品無關。

借助Trinetx等聯邦電子健康記錄(EHR),可以從各個地區擷取大量的患者資料。不利的一面是,這仍然隻是潛在學科總數的一部分,通常缺少資格認定所需的細節。

通過提出社交問題可以減輕許多失敗的情況。可能有助于減少確定完整的跟蹤主題組所需的時間和資源。

3. 真實證據

當組織和團隊意識到這一現實時,那裡的資料利用不足,價格便宜,并且數量和範圍不斷擴大。這些資料通常無法以其他任何方式擷取,并且代表了個人或個人群體的更真實的圖畫。在生命科學領域的某些圈子中,此資料稱為“真實世界證據”。

研究人員正在談論的是來自健康跟蹤器和可穿戴裝置的資料,電子病曆和調查資料,醫院和藥房資料,社交媒體和消費者資料。雜亂的資料不是來自受控的臨床試驗,即任何不整齊地放入表格中的資料。

越來越多地将該資料視為以前無法獲得或無法識别的信号的驅動器。除了這些“新”資料便宜外,它還使制藥公司能夠覆寫以前無法通路的人群。此外,資料還包括出于道德考慮而不允許公司提出的問題。

這些“世界信号”為臨床試驗提供了擴充的範圍,其中主要涉及的人群并不典型。保羅指出,受試人群的人口統計往往是年輕的,受過大學教育的白人男性。是以,需要“真實世界的證據”-但是它将如何幫助減少成本和時間呢?

4.解決方案

  • 來自異類資源的最新可通路“真實世界證據”社交資料-雜亂資料;
  • 識别和發現新患者庫的機會;
  • 有機會更快,更準确地獲得資格,避免在不合格的科目上花費時間和金錢;

Paul和他AstraZeneca的團隊提出的解決方案是試驗從業人員的社交圖譜。Paul稱其為“惡性良性腫瘤醫生臉書”。該圖将通過他們的協作,出版物和工作場所将他們聯系起來。他們可以使用“現實世界證據”的各種來源來注釋圖形,并詢問有關這些從業人員的問題。

該項目被稱為OPSIN-惡性良性腫瘤醫生社會互動網絡,作為“精簡和激發臨床試驗”的更大努力的一部分。

2008年,一個團隊使用“手動”圖形資料庫将一個類似的概念組合在一起,在網際網路上搜刮了所有可以讓他們找到關鍵意見領袖的資料。今天,可以使用如此豐富的資訊和技術平台來解決此問題。

藥物開發的社交圖譜Social Graphs for Drug Development

此外,可以将現在可用的外部資訊與他們的所有内部資料相結合,也許更重要的是,它可以伴随多年的試驗和磨難而獲得的知識。

5. 建立社交圖譜

從前輩那裡學到的東西,這些早期的努力一直存在着一些問題。關鍵是它們不是為可持續性而建構的-這些早期圖表的建構不僅僅是一個一次性的項目。Paul指出,這些通常是由使用R或一起入侵python腳本的人建構的,手工建立自己的圖形資料庫。

這些都不适合操作,需要将其插入其他系統,以便組織中的團隊能夠使用它。這是Grakn介入的地方。

Grakn是來自Grakn Labs團隊的複雜資料資料庫。知道阿斯利康(AstraZeneca)的團隊将對邊緣,出處邊緣以及對邊緣進行陳述感興趣之後,他們才意識到他們真正在談論的是超圖。Grakn作為一個超圖資料庫,使這一過程變得更加容易。

6.模型基礎

對于熱愛形式圖式的生物資訊學家來說,他們經常在争先恐後地将内部龐大的本體放入其中,而不考慮這種情況是否适合這種情況。Paul在Grakn Labs的某些團隊的鼓舞下,從不以現有的本體論開始,而是以一系列他們想問的問題開始。從以上思路出發,将在下面介紹生物資訊學家可能提出的一些問題。

但是,由于他們确實需要模式,是以以下是他們做出的一些決定:

  • 讓事情從簡單開始,不要一開始就為整個世界模組化;
  • 使用您要提出的問題作為模型潛在概念的一種方法,當大聲地或在紙上清晰地表達問題時,能夠更清楚地看到事物;
  • 從人和機構開始,通過諸如合作和出版之類的關系将它們聯系起來;
  • 給這些關系中的每個關系一個時間元素作為屬性;
  • 将範圍保持在5年-人和人際關系發生變化,5年對于目标而言足夠相關。

7.結論

制藥界變得越來越以資料為驅動力的情況下,仍然要問很多軟問題,這些問題将為臨床試驗過程帶來巨大的價值。那裡有大量的資料可以用來解決這些問題。

藥物開發的社交圖譜Social Graphs for Drug Development