本文转载自公众号“读芯术”(ID:AI_Discovery)。数据生产 新的科学东西令人激动,新的家的具包框架、新的工具仪器、新的列表工具,都会让生活变得更轻松。提高保持更新很难,效率我们需要花更多的数据生产时间在其上。 当然,科学我们并不是家的具包要一直更新到最新的发现,它可能是工具某个特定库的新的小版本,也可能是列表处于兴趣或是工作需要而寻找。现在开始吧! 从R转为python可以试试plotnine,这是一个基于ggplot2的Python图形语法呈现方式。 概念:你将实际使用的笔记应用程序 这些工具值得好好探索一阵儿啦。W&B 使用 Tensorflow的例子 无代码机器学习?Obviously AI也许是AutoML的网站模板下一步。上传(或连接)数据、选择目标就足够了,剩下的工作将由ObviouslyAI进行访问ML过程,使其让任何人都可以访问。它们还为你生成一个决策图谱,提供一个可解释的模型。
使用AT&T数据集的例子 ML Playground:运行不同的算法,添加神经网络,删除图层,绘制数据,或上传自己的数据。 Papers with code:正如其名,找到Github的脚本文件,准备被分叉开。 Clever Grid:一个1核的图形处理器和250GB的培训数据,每天约10欧元。 AWS DeepRacer:训练你的自动驾驶(模型)车,在著名的F1赛道上与其他人竞争,比如巴塞罗那——加泰罗尼亚赛道。你也可以在亚马逊上购买DeepRacer汽车的硬件版本。
MusicTime for Spotify:一个VSCode编辑器插件,它可以在编写代码时发现最受欢迎的音乐。 gspread_dataframe:是否必要把padas库中的数据发送到Google Sheets。 Kite:AI遇到代码自动完成提供建议,它们为主要的pythonide提供插件,比如VSCode、Pycharm和Spyder。
PuLP:对整数规划和线性规划有兴趣吗?对生产优化或多武装犯罪分子之类的问题感兴趣吗?看看他们的案例研究吧。 使用Scikit Learn、Keras和TensorFlow进行实际操作机器学习:构建智能系统的概念、工具和技术:这本书数据科学家得人手一本,它涵盖了从基本到高级的数据科学主题,十分实用且包含如何手动操作。 datatau:数据科学领域的黑客新闻。 Deta:一个慷慨大方的免费云端储存提供商。 寻找副业项目?找到你感兴趣的副业并参与其中,去看看 Solodoers吧。 cookiecutter-data-science:数据科学的项目引导者。数据科学的代码质量无非是正确性和再现性问题。 tqdm:我们一直希望在for循环中有一个进度条。 ELI5:可视化和调试各种机器学习模型,从黑匣子到可解释的人工智能。
ELI5 在文本分类中应用实例 gpxpy:你知道你可以把最喜欢的跑步应用程序数据导出到一个.gpx文件中吗?这些文件可以被解析成pandas,我曾经做过类似的事情,从一次帆船旅行中导出数据:
《找到你的第一份数据科学工作》:一本免费的关于数据科学职业生涯和专家建议的书,一共70页。 GluonTS:基于mxnet的亚马逊方式概率时间序列建模。
Lifelines:实现通用生存分析模型的Python库。生存分析广泛用于预测事件在特定时间发生的可能性,例如,客户将取消订阅我们的服务。 tensor-house:一个企业操作的参考机器学习和优化模型集合,对于想学习如何使用不同的机器学习模型来解决不同问题的人来说非常有趣。 Gradio:让模型创建易于使用的界面设计,对于展示模型预测非常有帮助,包括自然语言分析、图像和回归。