微信号:BigDataDigest

介绍:普及数据思维,传播数据文化

资源 | 过去一年最牛逼的30个机器学习项目!

2018-11-29 12:03 大数据文摘

大数据文摘出品

编译:刘思佳、张秋玥、云舟


这是一个竞争极为激烈的列表!


因为这是从2017年1月至12月期间发布的最佳开源机器学习库、数据集和应用程序里精心挑选出来的。挑选的基数高达8800个。


这是一个评价严谨的列表!


为了更好地评价这些项目,使用Mybridge AI,并且综合考虑受欢迎程度、参与度和新颖度。


那么,开始吧!让我们一起看看这份列表~~~


注:此份列表的星星数量仅供参考,因为,github上的星星数量是动态变化的。


No 1 FastText


用于快速文本表示和分类的库。 [Github评价:11786颗星]。


https://goo.gl/VWGfCs


来自Facebook Research


注:基于FastText  的一款名为 Muse 的多语种无监督或有监督的词嵌入项目在github上获得星星数为695.


No 2 Deep-photo-styletransfer


论文 “深度照片风格转换”的代码与数据[Github评价:9747颗星]。 


链接:https://github.com/luanfujun/deep-photo-styletransfer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Fujun Luan博士,康奈尔大学


No 3


全世界最简单的面部识别API,基于Python与命令行 [Github评价:8672颗星]。 


https://github.com/ageitgey/face_recognition?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Adam Geitgey


No 4 Magenta


通过机器智能生成的音乐和艺术 [Github评价:8113颗星]。


https://github.com/tensorflow/magenta?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



No 5 Sonnet


基于TensorFlow的神经网络库 [Github评价:5731颗星]。


https://github.com/deepmind/sonnet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


 来自Malcolm Reynolds,Deepmind


No 6 deeplearn.js


用于网络的硬件加速机器智能库 [Github评价:5462颗星]。


https://github.com/PAIR-code/deeplearnjs?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Nikhil Thorat,Google Brain


No 7


基于TensorFlow的快速风格转移 [Github评价:4843颗星]


https://github.com/lengstrom/fast-style-transfer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Logan Engstrom,MIT



No 8 Pysc2


星际争霸II学习环境 [Github评价:3683颗星]。 


https://github.com/deepmind/pysc2?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Timo Ewalds,Deepmind


No 9 AirSim


基于虚幻引擎的开源模拟器,适用于Microsoft AI和Research的自动驾驶交通工具 [Github评价:3861颗星]。 


https://github.com/Microsoft/AirSim?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Shital Shah,Microsoft


No 10 Facets


机器学习数据集的可视化 [Github评价:3371颗星]。 


https://github.com/PAIR-code/facets?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Google Brain


No 11 Style2Paints


AI图像着色 [Github评价:3310颗星]。


https://github.com/lllyasviel/style2paints?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



No 12 Tensor2Tensor


广义序列模型及序列模型的库 [Github评价:3087颗星]。


https://github.com/tensorflow/tensor2tensor?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Ryan Sepassi,谷歌大脑


No 13


PyTorch图像转换(例如horse2zebra,edges2cats等)[Github评价:2847颗星]。


https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Jun-Yan Zhu博士,加州大学伯克利分校。


No 14 Faiss


用于高效相似性搜索和密集向量聚类的库 [Github评价:2629颗星]。 


https://github.com/facebookresearch/faiss?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Facebook Research


No 15 Fashion-mnist


一个类似MNIST的时尚产品数据库[Github评价:2780颗星]。


https://github.com/zalandoresearch/fashion-mnist?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Han Xiao,Zalando Tech科研学者


No 16 ParlAI


在各种公开可用的对话数据集上训练并评估AI模型的框架 [Github评价:2578颗星]。


https://github.com/facebookresearch/ParlAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Alexander Miller,Google Research


No 17 Fairseq


序列到序列工具包 [Github评价:2571颗星]。


https://github.com/facebookresearch/fairseq?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Facebook AI Research


No 18 Pyro


使用Python和PyTorch进行深度通用概率编程 [Github评价:2387颗星]。


https://github.com/uber/pyro?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Uber AI Labs


No 19 iGAN


基于GAN的交互式图像生成 [Github评价:2369颗星]。


https://github.com/junyanz/iGAN?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more




No 20 Deep-image-prior


不基于学习的神经网络图像恢复 [Github评价:2188颗星]。


https://github.com/DmitryUlyanov/deep-image-prior?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Dmitry Ulyanov博士,Skoltech


No 21 Face_classification


基于keras CNN模型和openCV、使用fer2013 / imdb数据集进行实时人脸检测和情感/性别分类。 [Github评价:1967颗星]。


https://github.com/oarriaga/face_classification?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



No 22 Speech-to-Text-WaveNet


使用DeepMind的WaveNet和tensorflow的端到端句子级英语语音识别 [Github评价:1961颗星]。来自Namju Kim,Kakao Brain。


https://github.com/buriburisuri/speech-to-text-wavenet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



No 23 StarGAN


用于多域图像转换的统一生成式对抗网络 [Github评价:1954颗星]。


https://github.com/yunjey/StarGAN?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Yunjey Choi,Korea University


No 24 Ml-agents


Unity机器学习代理 [Github评价:1658颗星]。


https://github.com/Unity-Technologies/ml-agents?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Arthur Juliani,Unity3D Deep Learning


No 25


DeepVideoAnalytics:分布式视觉搜索和可视化数据分析平台 [Github评价:1494颗星]。


https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



No 26 OpenNMT


基于Torch的开源神经机器翻译 [Github评价:1490颗星]。


https://github.com/OpenNMT/OpenNMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



No 27 Pix2pixHD


使用条件GAN合成并处理2048x1024图像 [Github评价:1283颗星]。 


https://github.com/NVIDIA/pix2pixHD?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自AI研究科学家Ming-Yu Liu,Nvidia


No 28 Horovod


TensorFlow的分布式培训框架 [Github评价:1188颗星]。


https://github.com/uber/horovod?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Uber Engineering


No 29 AI-Block


一个功能强大且直观的WYSIWYG界面,允许任何人创建机器学习模型 [Github评价:899颗星]。


https://github.com/MrNothing/AI-Blocks?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


No 30 


基于Tensorflow的语音转换(语音样式传输)深度神经网络 [Github评价:845颗星]。


https://github.com/andabi/deep-voice-conversion?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


来自Dabi Ahn,Kakao Brain AI Research


另外,推荐两个非常好的学习材料:

  • 年度Python项目(平均3,707颗星)

    https://goo.gl/sqdPgW

  • 过去一年关于学习机器学习的热门文章

    https://goo.gl/GLdu6r


相关报道:

https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7?nsukey=meOrGP1tkmxojNUefLXxHh8132657wun6l2jRHUzia47eJTA4ZzuKLbqBsZ7LHBz0AG3kWld3ueXHaJ4jj42lITTmXt1M6VDyqPXpxPAiIeWUOaECy6GoBNYJp4z%2FYgE%2BW%2BQGzke6038nQh4nHBUyHMs1RcK61It9QRuZg7LzYcn6vw%2F5VCwXSPFBjIC5M7miumCHCENttD5%2BmsdZAyROw%3D%3D


【今日机器学习概念】

Have a Great Definition

志愿者介绍

后台回复志愿者”加入我们

 
大数据文摘 更多文章 这些“秘密武器”,让你轻松跻身Kaggle前2% 我花了一年时间研究不确定性估算,写下了这份最全指南 公交车总迟到?你大概掉进了“等待时间悖论 15分钟破解保险箱!美国小哥200美元自制开锁机器人 Netflix大溃败:放弃算法崇拜,向好莱坞低头
猜您喜欢 回顾XtremIO全闪存阵列软硬件架构设计(留言赠书) 网易全新Scratch零基础开课,仅剩少量名额! 单用户沟通杀死大众传播? AI时代内容产业需跨越三座大山 从世界冠军到数据科学家 他是如何炼成的? | 牛人讲堂 计算机程序的思维逻辑 (4) - 整数的二进制表示与位运算