[返回科技频道首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
比Keras更好用的机器学习“模型包”:无需预处理,0代码上手做模型
送交者: 婉君[☆★★★不服⭐来赌★★★☆] 于 2020-10-04 2:28 已读 2011 次 1 赞  

婉君的个人频道

原标题:比Keras更好用的机器学习“模型包”:无需预处理,0代码上手做模型


萧箫 发自 凹非寺 6park.com

量子位 报道 | 公众号 QbitAI 6park.com

做机器学习模型时,只是融合各种算法,就已经用光了脑细胞? 6park.com

又或者觉得,数据预处理就是在“浪费时间”? 6park.com

一位毕业于哥廷根大学、做机器学习的小哥也发现了这个问题:原本只是想设计个模型,结果“实现比设计还麻烦”。 6park.com

于是他自己动手做了个项目 igel(德语中意为“刺猬”,但也是Init、Generate、Evaluate Machine Learning的缩写),无需编写任何多余代码,就能设计出想要的模型。 6park.com


也就是说,用户只需要知道各种机器学习模型的原理,但不需要再自己动手写代码。 6park.com

相比于Keras,这个项目进一步简化了预处理、输入输出的工作,就像“模型包”一样简便。 6park.com

作者用了两周的时间,做出了项目的1.0版本,一天以内已有842 Star,目前还在快速上涨中。 6park.com


由于只是1.0版本,作者表示,这个项目仍然有很大的完善空间。 6park.com

但就目前的功能来说,已经足够进行基本的机器学习建模了。 6park.com

“让机器学习生产变得自动化” 6park.com

作者建立这个项目的初衷,是希望为所有人提供机器学习模型。 6park.com

无论是技术向工程师、还是非技术向的其他行业用户,都能使用机器模型让自己的工作更简单。 6park.com

说白了,就是将机器学习变成一个“自动化”的过程,而他也这么设计了。 6park.com

项目igel包含了当前最新的所有机器学习模型 (回归、分类、聚类),而且作者表示,项目还在持续更新中。 6park.com


也就是说,后续如果还有更新的机器学习模型,也会再加进项目。 6park.com

模型目前支持的功能有以下几种: 6park.com

支持所有最新的机器学习模型(甚至是预览模型) 6park.com

支持不同的数据预处理方法 6park.com

在编写配置时提供灵活性和数据控制 6park.com

支持交叉验证 6park.com

支持yaml和json格式 6park.com

支持不同的sklearn指标以进行回归,分类和聚类 6park.com

支持多输出/多目标回归和分类 6park.com

支持多处理并行模型构建 6park.com

支持所有最新的机器学习模型(甚至是预览模型) 6park.com

支持不同的数据预处理方法 6park.com

在编写配置时提供灵活性和数据控制 6park.com

支持交叉验证 6park.com

支持yaml和json格式 6park.com

支持不同的sklearn指标以进行回归,分类和聚类 6park.com

支持多输出/多目标回归和分类 6park.com

支持多处理并行模型构建 6park.com

可以看出,作者为了 偷懒让机器学习生产变得更简洁,也是操碎了心。 6park.com

如果要上手的话,也非常简便。 6park.com

6步上手“模型包” 6park.com

与其他程序一样,作者为这个程序提供了“帮助”菜单,只需要输入“igel -h” (或igel -help),就能了解它的使用方法。 6park.com


学习完使用方法后,就可以开始创建配置文件了,无论是yaml还是json格式,都ok。 6park.com

如果你是个“懒癌患者” (像作者一样),可以使用“igel init”来初始化。 6park.com

例如,想做个判断“是否生病”功能的配置文件: 6park.com

第一步,选择功能、模型、目标:igel init -type “classification” -model “NeuralNetwork” -target “sick” 6park.com

第二步,初始化:igel init 6park.com

第一步,选择功能、模型、目标:igel init -type “classification” -model “NeuralNetwork” -target “sick” 6park.com

第二步,初始化:igel init 6park.com

那么,程序就会给你生成一份配置文件,根据需要进行修改。 6park.com


在那之后,就是选择具体的算法参数、并提供你所选的数据集了。 6park.com

例如,想用随机森林处理数据,那么,只需要提供参数给系统 (以及数据集、配置文件路径),它就会帮你训练: 6park.com


此外,还可以对模型/预训练模型进行评估: 6park.com


感觉不错?生成预测模型: 6park.com


直接用起来: 6park.com


简单6步,机器模型 (预览模型)就已经生成了,非常方便。 6park.com

网友:太棒了,想要更多新功能 6park.com

此外,作者也非常乐意采纳各个网友的意见。 6park.com

例如,一个网友指出,如果能用交叉验证进行超参数搜索/调整,那么会是个很好的改进,而作者本人也立即采纳了这个建议。 6park.com


不过,也有网友表示,“让一切程序自动化”是没有意义的。 6park.com


毕竟作者已经声明,项目是建立在scikit-learn的基础上的。但后者同样几行代码就能做机器学习,那么scikit-learn和这个项目有什么区别? 6park.com

作者对此回应称,最大的区别在于,相比于编写代码,这个项目旨在以更“可读”的方式设计想做的模型。 6park.com


有网友认可这样的观点,毕竟对于许多做生产的机器学习工程师来说,“任何不需要做的编程工作”都是没有意义的,是在“浪费时间和金钱”。 6park.com


对于这个项目,更多的网友表示了支持,并希望看见他的新功能。 6park.com


对这个机器学习项目感兴趣的小伙伴,可以通过下方传送门查看~ 6park.com

作者介绍 6park.com


Nidhal Baccouri,于今年4月在德国哥廷根大学取得硕士学位,研究方向是软件、控制工程和人工智能。 6park.com

目前,Nidhal Baccouri在汽车行业工作,研究方向是数字双胞胎技术,会同时应用人工智能和物联网的知识。业余时间,他喜欢做做项目,尤其是与AI和Python相关的项目。 6park.com

传送门 6park.com

项目地址: 6park.com

https://github.com/nidhaloff/igel 6park.com

6park.com

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。 6park.com

榜单征集!7大奖项锁定AI TOP企业 6park.com

「2020中国人工智能年度评选」正式启幕!将从公司、人物、产品、社区四大维度共7个奖项寻找优秀的AI企业,欢迎大家扫码报名参与。 6park.com

榜单将于12月揭晓,也期待与百万从业者们,共同见证这些优秀企业的荣誉! 6park.com

量子位 QbitAI · 头条号签约作者 6park.com

վ'ᴗ' ի 追踪AI技术和产品新动态 6park.com

一键三连「分享」、「点赞」和「在看」 6park.com

科技前沿进展日日相见~

评分完成:已经给本帖加上 10 银元!

喜欢婉君朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 婉君的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回科技频道首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]