天天看點

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

作者:新智元

編輯:Cris 好困

【新智元導讀】想讓檢索代碼不再「大海撈針」?就用「Feep! search」。

一款專門面向程式員的搜尋引擎,2021年9月才開工,卻收錄了超過2900萬頁資訊。這樣的「程式設計神器」,你願意嘗試嗎?

這兩天,草根開發者浮士德釋出了一款名為「Feep! search」的搜尋引擎。隻要在檢索框中輸入你想找的程式名稱,分分鐘便能檢索出成百上千條成熟代碼。

雖然這款「程式設計神器」還存在着不少問題,卻已經令不少苦兮兮的程式猿、程式媛們心馳神往,堪稱今年「1024」最好的禮物。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

Feep! search

「Feep! search」是一款程式員專用的網絡搜尋引擎,主要用于程式設計資源的查找。

雖然名稱采用了與雅虎(Yahoo!)相似的結構,但與美國門戶網站的明貶實褒(Yahoo原意為鄉巴佬)不同,「Feep」在《新黑客詞典》中特指「終端發出的柔和電子鈴聲」,尾部的「!」則代表了想要為使用者提供令人難忘的服務。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

目前,「Feep! search」能夠檢索的資訊源,包括DevDocs、Hacker News、Kiwix、Stack Exchange等,甚至還包括一些已索引但未爬網的連結,資訊總量超過2900萬頁——這甚至比谷歌1998年推出的第一款搜尋引擎還要多(2600萬頁)。

據網站作者浮士德介紹,「Feep! search」在檢索時會查找它所存儲的所有資訊,對一些資料進行少量排序,并填充到搜尋網站的結果頁中。

資料混洗位主要用Node.js編寫,許多shell腳本将所有内容粘在一起,排名和全文搜尋則由ElasticSearch提供支援。這一切都在他家客廳的HP微型伺服器裡運作。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

位于浮士德客廳的「Feep! search」伺服器

以程式員們最經典的上手程式「hello word」為例,僅用時27毫秒,「Feep! search」那簡潔而不簡單的界面便檢索出超1萬條結果。你可以從中輕松找出許多能夠實際運作的成熟代碼。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

而且,搜尋結果的資訊來源,也是相當豐富的。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

在浮士德的文章下,不少網友表示「Feep! search」真乃程式員的福音:

「很棒的作品。(我)在同一主題不同變體的三次搜尋中得到了一些好的答案和有用的連結。」

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

也有部分網友在體驗後發現了問題:

「好主意,但現在的搜尋很糟糕。對『django signals』進行檢索,第一頁得到了非官方的結果,第二頁(1)上的所有連結都斷了。搜尋『go cobra』則根本沒有官方文檔。」還在最後提出了一些改進建議。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

美中不足

就連作者自己也承認,因為尚未設定任何搜尋運算符或進階搜尋文法,導緻引擎的搜尋結果相當多變,搜尋結果的排名不能很好地獲得展示。

不過,對于一些檢索時的常見問題,作者也在「Query help」頁面進行了備注:

  • 單詞被詞幹化(例如「walking」、「walk」等都将被轉換為「walk-」),并逐個搜尋。目前還沒有任何方法可以關閉這個功能,或者搜尋完整的短語;
  • 非字母數字字元将被忽略(這意味着你不能搜尋符号運算符之類的東西。這對于一個專門為程式員設計的搜尋引擎來說非常尴尬。這也是我要着重解決的問題之一);
  • 語句的了解非常膚淺:它不尋找同義詞,也不了解同一個詞在不同的上下文中可能有不同的含義(這與谷歌截然相反,即使你有非常具體的想法,谷歌也會盡力猜測你的其他意思。哪種方法最有用取決于你尋找的方式)。改變查詢的措辭可能會得到一組完全不同的結果;
  • 如果沒有搜尋到你要找的内容,請嘗試添加或删除單詞。有時看似微小的調整都會産生巨大的差異。您需要的結果可能就在某個地方,即使可能很難找到;
  • 有時候,好的結果有些被埋沒了。建議您多浏覽幾頁,看看要找的内容是不是在後面。
Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

值得一提的是,每頁檢索結果的末端還提供了Google、DuckDuckGo、Bing和Marginalia四種其他搜尋引擎的連結,一鍵即可進入對應詞彙在各大引擎中的檢索結果。

作者特别向我們推薦了一款獨立的DIY搜尋引擎Marginalia Search。與「Feep! search」類似,這是一款專注于推薦「你可能不知道網站」的搜尋引擎。這個搜尋引擎中的軟體都是定制而成,所有的爬網和索引都在内部完成的。

小人物的大夢想

「Feep! search」的作者沃爾夫岡·浮士德(Wolfgang Faust)是一名專業軟體開發商和業餘愛好者。

通過浮士德的個人網站我們可以了解到,雖然曾發表過大大小小上百項程式,但他卻是一名不折不扣的草根開發者。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

正如浮士德個人網站的Slogan「我做了很多不同的事情」所言,2011年至今,他在GitHub上共更新了111條作品,但賬号目前也隻有25個粉絲。一款名為「yaml-multiline」的開源軟體,總計獲得過216顆星和16次引用——這已是浮士德開發生涯的扛鼎之作。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

不過,他在兩大論壇Hacker News和Reddit上卻分别收獲了4,004和3,712次「功德」,具有極強的表達欲望,也可以說非常努力了。

不管怎麼講,能制作出一款收錄接近3000萬頁資訊的搜尋引擎,都是一項十分了不起的成就。

畢竟當年Google剛推出時,也同樣問題重重。

Feep! search:一款面向程式員的搜尋引擎,收錄資訊超2900萬頁

參考資料:

https://search.feep.dev/about/

https://news.ycombinator.com/item?id=33494221

https://www.wolfgangfaust.com/

繼續閱讀