天天看點

ruby html轉純文字

gem install hrpicot_scrub
           
require 'rubygems'
           
require 'hpricot_scrub'
           
doc = Hpricot("<p>haha</p>")text = doc.scrub
           
上面用的這個hrpicot_scrub已經兩個年沒更新了 找到一個經常更新的 下載下傳量也很大的
gem install nokogiri
           
require 'rubygems'
require 'nokogiri'

puts Nokogiri::HTML(my_html).text