天天看點

科學計量學法回顧現有的資料驅動工程設計

作者:葛劍生

大資料的探索和挖掘為工程設計提供了大量的機會,是以在過去的二十年中,有關工程設計和産品開發的資料迅速增加。然而,由于大量的資料源和格式加上設計過程的高度複雜性,這些技術尚未充分發揮其最大潛力。

通過科學計量學方法進行了系統的文章擷取程式,從Web of Science (WoS)和Scopus中提取了3339篇與工程設計和大資料分析應用相關的文章,而後通過簡明的資料篩選,将該資料集縮減為366篇文章的資料集。

通過這些文章,分析近20年來資料驅動工程設計(DDED)研究的動态,并檢測與DDED相關的主要研究主題、最有影響力的作者以及在DDED領域影響最大的論文。

此外,使用科學計量學法建構并分析了關鍵詞/關鍵短語共現網絡和合著者網絡,揭示相關研究課題的互聯性和最高産作者之間的合作關系,對過去20年來最先進的DDED進行了全面的評估。

DDED研究的年度演變

調查過去20年來與DDED相關的文章,提取了366種相關出版物的出版年份和出版類型,下圖顯示了過去二十年來每年的出版物數量。文獻檢索于2021年6月28日進行,包括截至該日期出版的所有相關期刊文章、會議論文和書籍章節。

科學計量學法回顧現有的資料驅動工程設計

由于文章标引的時間延遲,2020年和2021年的發表文章數量低于前兩年。此外,2020年,會議投稿數量有所下降,這可能是由于對COVID-19大流行期間線上召開的科學會議的興趣下降。

由圖可知,2015年之後,與ddd相關的出版物出現了強勁的增長。

在金融、商業、創新管理、制造業、市場營銷和使用者體驗等其他領域,也可以觀察到資料科學和大資料研究的類似增長趨勢。

關于産品、使用者及其環境的資料擷取工具和方法的發展,大資料分析的新算法、方法和工具的發展,以及計算能力的增強和存儲能力的改進,使得資料科學在各個領域的整合變得更加容易,進而支援了資料驅動技術的快速發展。

此外,在工程設計中,改進的産品資料管理工具和平台也影響了這些技術的更快采用。有了新的工具,流程和設計師的行動可以很容易地跟蹤,以及在産品開發和制造操作期間做出的決定。

同時,實時資料采集技術和更大的存儲容量可以促進産品在使用過程中的監控和記錄使用者與産品的互動。各種網絡收集技術擴大了配置設定和檢索各種産品和使用者資料的可能性。是以,許多進一步研究的機會是可能的。

有研究表明,資料驅動工程設計的研究文章數量逐年增加似乎與人工智能發展的增長趨勢相一緻。預計在今後幾年中,這一領域的貢獻将進一步擴大。

DDED中的主題

資料驅動工程設計是一個廣泛的研究領域,涵蓋了各種主題從收集的文章中提取的關鍵詞調查DDED中出現的主要主題,結果顯示了BDA在工程設計中的常見術語和應用領域,揭示了工程設計中最大、研究最多的領域和課題。

所進行的分析呈現了DDED中現有研究的知識圖譜,然而,新興趨勢的識别需要額外的分析。下圖為資料驅動工程設計文章作者關鍵詞共享網絡。

該網絡将最常用的術語及其關系可視化,表明哪些關鍵詞經常一起出現,以及DDED中研究主題的結構。

科學計量學法回顧現有的資料驅動工程設計

頂點對應于關鍵字,它們之間的連結(連接配接)表示兩個關鍵字同時出現的文章,頂點的大小表示頂點的程度,即與特定關鍵字的連接配接數。為了使表示更清晰,上圖中的網絡隻包含度≥20的頂點,實際的網絡比濃縮的可視化包含更多的關鍵字和關系。

由上圖可知,關鍵詞“機器學習”、“資料挖掘”和“大資料”出現次數最多。并且“大資料”和“機器學習”一般都與“産品設計”和“産品開發”聯系在一起。

“資料驅動設計”通常與“資料挖掘”、“大資料”和“産品服務系統”結合在一起,而“機器學習”與“人工智能”有着密切的聯系。

一個緊密相連的叢集包括關鍵詞“客戶評論”、“感性工程”、“情感分析”、“情感設計”和“意見挖掘”。這些關鍵詞包括研究最多的資料源和在早期設計階段使用的幾種分析方法和方法,其中調查了使用者偏好。

圍繞該聚類的BDA技術是“文本挖掘”、“關聯規則”、“決策樹”和“自然語言處理”,它們适用于文本分析。在左側,關鍵詞“創意”與“設計過程”有關,而“聚類”和“文本挖掘”這兩種技術則與“概念設計”階段進一步接近。

在圖的右上方,有一組人将“機器學習”與“計算機輔助設計”、“CAD”、“設計優化”、“仿真”和“資料驅動工程”等關鍵詞聯系起來。這些術語可能與實施例設計階段有關,在該階段使用CAD和CAE工具進行虛拟原型設計。

将BDA技術在設計中的應用稱為資料驅動工程。圖的下半部分指出了另一個主題,将“大資料”與“制造”、“智能制造”、“數字孿生”、“産品生命周期”和“網絡實體系統”聯系起來。

這意味着對資料驅動工程設計的研究,其重點是利用來自制造和産品開發後續階段的資料來改進産品和服務設計。最常列在一起的關鍵詞用粗線連接配接,這提供了有關DDED中相關概念的資訊。

根據上圖中出現頻率最高的關鍵詞,即可以識别出DDED中的主要主題。

回顧DDED作者、生産力和影響力

使用科學計量學法确定DDED中最具影響力的作品,通過分析每篇文章的名稱、所屬機關、引用次數和标題,來發現發現了活躍在DDED中的研究人員、最高産的作者和最具影響力的論文的地理分布,進而揭示了資料驅動方法在設計中的應用領域。

下圖顯示了研究資料驅動工程設計的出版物的地理分布,它描述了擁有兩種或兩種以上出版物的國家。出版物根據第一作者所屬的國家被配置設定到一個特定的國家,放置在每個國家的圓圈的大小與每個國家生産的物品數量相對應。

由圖可知美國發表論文80篇,中國發表論文76篇。緊随其後的是德國(40人)、英國(31人)和新加坡(21人)。很明顯,美國和中國在資料驅動工程設計的研究和應用方面占據主導地位。

科學計量學法回顧現有的資料驅動工程設計

根據科學計量學法所得到的資料集,如果兩位作者一起發表了至少兩篇論文,則用一條線将他們連在一起。

頂點的大小對應于一個作者與其他作者的連接配接數,而連結的寬度與兩個作者共同擁有的文章數成正比。在該網絡中,顯示了最小權重為7的連接配接,結果在11個叢集中連接配接了116位作者,網絡圖如下。

科學計量學法回顧現有的資料驅動工程設計

資料驅動工程在數字孿生中顯示着重要影響。近年來,數字孿生的概念對制造業産生了重大影響。它指的是建立一個由實時資料提供的産品或系統的虛拟雙胞胎,目的是獲得系統行為的更真實的圖像。

在工業4.0的背景下,傳感器與物聯網和基于雲的系統的應用使各種制造資料的收集、存儲和利用變得更加容易,進而可以改進機器和制造過程的監測、優化和控制。關于在産品設計中使用數字孿生的研究越來越多;然而,它仍處于早期階段。

資料驅動工程還在産品的情感設計中顯示着重要影響。關于使用者偏好和相關産品特性的新資料源正在被廣泛探索,使用不同的文本挖掘和機器學習技術進行檢索,例如線上評論。感性工學是一種将使用者偏好映射到産品設計特性的常用方法。

資料驅動的方法也可以用于産品功能的分析,支援開發設計概念。

大資料分析(BDA)在産品設計中的最早應用之一是産品族和産品組合設計,使用各種BDA技術,可以根據相似性對産品變體進行比較,并根據它們對技術、經濟和使用者需求的響應方式進行評估。

BDA是一個科學技術的總稱,它能夠組織大資料,分析和發現大資料中的知識、模式和智能,并将發現的知識可視化并報告,以協助決策。

根據科學計量學法對被引用最多的文章的分析中可以确定,資料驅動工程還對探索從現有設計資料中擷取設計知識的本體和語義網絡以及應用資料挖掘技術預測設計變更傳播顯示着重要影響。

BDA在産品開發中的應用

根據科學計量學法篩選了366篇文章,并使用文本過濾功能根據文章标題中的關鍵詞對文章進行分類。共有249件物品被分類,而考慮到關鍵詞,其中51個适用于兩個或多個類别。

在下圖中,這些文章被包含在所有類别中,并被自動排序。由于産品開發階段和活動之間沒有明顯的界限,有時也有重疊,是以這些物品被配置設定到更多的類别。

科學計量學法回顧現有的資料驅動工程設計

從資料庫獲得的366篇相關文章中,總共有117篇未按産品開發活動分類。這包括更廣泛的評論文章、專注于教育的研究、總體設計原理和啟發式的提取、可持續性設計、設計協作研究、過程挖掘和其他主題。

分類為不同産品開發活動的文章根據所使用的BDA技術進一步分類。對文章标題和摘要進行與BDA技術相關的關鍵詞自動搜尋。下圖展示了BDA技術到産品開發活動的映射,在文章中找到了應用示例。

由于所有文章都沒有采用标題或摘要中所述的BDA技術,是以映射所包含的文章少于按産品開發活動分類的文章。

科學計量學法回顧現有的資料驅動工程設計

在搜尋的文章裡,BDA技術在不同活動中的主要應用為:

建構以使用者為中心的設計推薦系統;用于意見挖掘和情感設計,使用感性工程方法和情感分析進行處理;挖掘社交媒體和線上評論的文本;使用有關産品群組件功能的下遊資訊來促進類似産品的構思和概念生成。

識别功能和關鍵産品特征;開發新産品功能推薦系統;産品概念開發以及幫助概念選擇和評估;探索動形狀設計空間,以及将BDA內建到拓撲優化和生成設計系統;指導設計優化,提高最優搜尋效率;提取模拟結果的大型資料集中有影響的模拟參數。

生産成本評估,視覺檢查和品質控制,産品可制造性評估,故障預測以及在計算機視覺中使用深度學習;還可用于車削表面粗糙度預測的分類和回歸技術,焊接中的應用,钣金成形和增材制造。

智能産品服務系統,優化設計并為使用者提供新服務;挖掘曆史服務文檔的文本,開發了考慮産品元素和服務概念的服務演化圖,研發出一種幫助預測未來産品使用的方法;預測使用者選擇模型。

在過去的二十年中,超過60%的文章僅在最近五年内發表,這表明DDED研究将繼續發展和擴大。由于最近資料收集和處理技術的進步,以及實作BDA的工具和方法的個性化,這些結果是可以預料到的。

目前DDED的研究小組相當分散和脫節,這強調了目前想要發展DDED需要改善小組之間的合作,以促進研究領域的發展和增長。

當今擁有最多出版物和聯系的領先研究小組包括來自中國、新加坡、美國和德國的學者。他們的研究主題主要包括情感設計的客戶資料挖掘、資料支援的概念設計、産品服務系統設計、數字孿生和設計知識提取(早期産品開發階段和使用中的産品)。

開發新的資料采集和管理工具和算法将為開發新的資料源提供可能性。它們可以結合不同的人工智能手段,這将使收集到的資料有意義,進而有助于在開發過程的不同階段做出決策。

除了快速分析和解釋能力之外,這種智能系統将通過檢測人為錯誤和提供适當的建議,以及發現設計項目之間新的和未探索的聯系來幫助設計師。

現在DDED的發展面對着很多挑戰,而在所有這些挑戰領域中,仍然存在一個懸而未決的問題,即如何擷取和利用來自不同來源的資料,例如使用者響應、計算研究、模型、測試,這些資料通常以文本、數字或圖形等不同形式提供。

參考文獻:

Daria Vlah, Andrej Kastrin, Janez Povh, Nikola Vukašinović,

Data-driven engineering design: A systematic review using scientometric approach,Advanced Engineering Informatics,Volume 54,2022,101774,ISSN 1474-0346,https://doi.org/10.1016/j.aei.2022.101774.

繼續閱讀