NPOI處理Word文本中上下角标

2018-09-02 23:50:00

讀取Word文檔，并将文本轉成html标簽，後面發現，經常有帶上下角标的内容，于是一并處理了。

核心在于對XWPFRun對象中Subscript屬性的處理。

1         /// <summary>
 2         /// 讀取Word,并識别文本中的上下角标
 3         /// </summary>
 4         /// <param name="fileName"></param>
 5         /// <returns></returns>
 6         public static string ReadWordTextExWithSubscript(string fileName)
 7         {
 8 
 9             string fileText = string.Empty;
10             StringBuilder sbFileText = new StringBuilder();
11 
12             #region 打開文檔
13             XWPFDocument document = null;
14             try
15             {
16                 using (FileStream file = new FileStream(fileName, FileMode.Open, FileAccess.Read))
17                 {
18                     document = new XWPFDocument(file);
19                 }
20             }
21             catch (Exception e)
22             {
23                 throw e;
24             }
25             #endregion
26             //正文段落
27             foreach (XWPFParagraph paragraph in document.Paragraphs)
28             {
29                 //擷取段樓中的句清單
30                 IList<XWPFRun> runsLists = paragraph.Runs;
31 
32                 sbFileText.Append("<p>");
33                 foreach (XWPFRun run in runsLists)
34                 {
35                     switch (run.Subscript)
36                     {
37                         case VerticalAlign.BASELINE:
38                             sbFileText.Append(run.Text);
39                             break;
40                         //上角标
41                         case VerticalAlign.SUPERSCRIPT:
42                             sbFileText.Append("<sup>" + run.Text + "</sup>");
43                             break;
44                         //下角标
45                         case VerticalAlign.SUBSCRIPT:
46                             sbFileText.Append("<sub>" + run.Text + "</sub>");
47                             break;
48                         default:
49                             sbFileText.Append(run.Text);
50                             break;
51                     }
52                     
53                 }
54                 sbFileText.AppendLine("</p>");
55             }
56             fileText = sbFileText.ToString();
57 
58             return fileText;
59         }

Word文檔：

輸出：

測試上下ok。

CO2

面積約6000km2

Html預覽：

NPOI處理Word文本中上下角标

繼續閱讀

SAP ABAP maintanence view的資料校驗機制Subject: RE: Validate data in maintanence view

SAP S/4HANA CDS view的擴充原理

如何基于SAP CDS view建立OData服務PrerequisiteSteps

世界頂尖精密儀器技術都掌握在哪些國家？

SAP UI5 BindingParser

SAP UI5 return sap.ui.view的實作

SAP UI5 app view router - Haiji&#39;s application

SAP ABAP實用技巧介紹系列之如何建立Maintenance view

使用CDS view找出SAP CRM狀态為open的那些訂單done on 2017-06-10 10:07AM ER9/001

SAP S/4HANA裡extension include view和extension view的差別

SAP ABAP maintanence view的資料校驗機制

SAP S/4HANA CDS view的擴充原理

SAP S/4HANA裡extension include view和extension view的差別

SAP S/4HANA CDS view的擴充原理

如何提取SAP UI5 XML view裡定義的字段元素綁定資訊(binding path）

Drug Target Review | 人工智能(AI)在基因組學中的作用