那些被低估的Python庫
在這篇文章中,我們想展示一些不同于流行的東西。這些都是深夜瀏覽GitHub的感悟,以及同事們分享的壓箱底東西。這些軟件包中的一些是非常獨特的,使用起來很有趣的Python包。
混合派
- Knock Knock:從Python發送通知到移動設備、桌面或電子郵件。
tqdm:可擴展的Python和CLI進度條,內置對pandas的支持。
Colorama:簡單的跨平臺彩色終端文本。
pandas -log:提供熊貓基本操作的反饋。非常適合調試長管道鏈。
Pandas-flavor:擴展pandas DataFrame/Series的簡單方法。
More-Itertools:增加了類似于itertools的額外功能。
streamlit:為機器學習項目創建應用程序的簡單方法。
數據清理和操作
- ftfy:修復mojibake和Unicode文本中的其他故障。
janitor:有很多很酷的功能來清理數據。
Optimus:另一個數據清理包。
Great-experctations:一個檢查數據是否符合預期的好工具。
數據探索和建模
- Pandas-profile:創建一個包含來自pandas DataFrame的統計數據的HTML報告。
dabl:允許使用可視化和預處理進行數據探索。
pydqc:允許比較兩個數據集之間的統計數據。
pandas-summary:對panda DataFrames描述功能的擴展。
pivottable-js:pands在jupyter notebook的拖放功能。
數據結構
- Bounter:有效的計數器,使用有限(有界)的數量的內存,無論數據大小。
Python -bloomfilter:可擴展的Bloom Filter,使用Python實現。
datasketch:提供概率數據結構,如LSH、加權MinHash、HyperLogLog等。
ranges:Python的連續范圍、范圍集和范圍令數據結構
性能檢查和優化
- Py-spy:Python程序的采樣分析器。
pyperf:用于運行Python基準測試的工具箱。
snakeviz:一個瀏覽器內的Python配置文件查看器,對jupyter notebook有很大的支持。
Cachier:Python函數的持久、無延遲、本地和跨機緩存。
Faiss:用于高效的相似性搜索和密集向量聚類的庫。
原文:
https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270
聲明:免責聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,也不承認相關法律責任。如果您發現本社區中有涉嫌抄襲的內容,請發
送郵件至:operations@xinnet.com進行舉報,并提供相關證據,一經查實,本站將立刻刪除涉嫌侵權內容。本站原創內容未經允許不得轉載,或轉載時
需注明出處:新網idc知識百科