天天看點

python:對英文段落進行分句(對一段英語進行整句切分,切分句子)

1. 示例代碼:

使用split函數進行分割,得到新的清單

split_sentence.py

# -*- coding: utf-8 -*-
"""
Created on Thu Jan 21 21:57:45 2021
@author: dell
"""

str_centence=input("input:  ")            #input函數擷取輸入
list_ret = list()

for s_str in str_centence.split('.'):   #對輸入進行處理  (用英文結尾句号.來劃分句子)
    s_str = s_str.replace('\n','')      #去掉句子中的\n換行
    
    if '?' in s_str:
        list_ret.extend(s_str.split('?'))
    elif '!' in s_str:
        list_ret.extend(s_str.split('!'))
    else:
        list_ret.append(s_str)

for s_str in list_ret:
    #print(s_str+".\n")
    s_str=s_str+".\n"         #每一個完整英語句子加上句号“.”,然後加個換行
    print(s_str)              #輸出
           

2. 運作結果:

選擇pdf文檔裡的一段英文,如下:

python:對英文段落進行分句(對一段英語進行整句切分,切分句子)

複制粘貼,當作輸入,輸出結果如下所示:

python:對英文段落進行分句(對一段英語進行整句切分,切分句子)

參考:

https://zhuanlan.zhihu.com/p/41804488  教你如何對英文段落進行分句