打开网易新闻 查看更多图片

人工智能的发展日新月异,如何让自己保持在技术发展的最前沿,是每个相关科技工作者致胜的关键。本文来自编译,希望对您有所启发。

Image by Werner Du plessis on Unsplash

数据科学的发展非常迅速。

五年前,如果你说对人工智能感兴趣,那么大概率你拥有一个量子数学博士学位。而现在,连我妈妈都会经常讨论 ChatGPT。

人工智能不再是一些虚无缥缈的东西,而是有着实实在在的进展。现在,你必须懂一些真材实料。那么,你如何才能跟进人工智能和数据科学领域的最新动态呢?

虽然网上已经有很多很好的建议了,但我发现,其他人推荐的许多策略对我不起作用。作为一名在工业界工作的数据科学家,我花在研究上的时间非常有限,而且把所有的时间都花在学术论文和技术发布文档上是没有意义的。我需要的是短小精悍、应用性强的资源,这些资源可以帮助我了解如何在日常工作中利用新技术。

在本指南中,我将总结一些对我来说有用的资源。我的目的是突出那些从应用角度(而不仅仅是商业或研究角度)有帮助的资料。如果你是一名数据科学家,那么我希望这些资源能帮助你在日常工作中走在科技前沿,并发现创新机会。

1. 阅读其他数据科学团队的博客

许多数据科学团队都有博客,我个人最喜欢的是 Netflix、Tripadvisor、Duolingo、Meta 和 Spotify 这些公司的团队博客。我喜欢这些博客的一点是,它们超级实用。虽然许多学术研究论文关注的是数据科学和机器学习的理论方面,但公司的博客倾向于强调“如何在实践中使用数据科学来解决现实世界的问题”。

作为一名在工业界工作的数据科学家,我发现这些确实很有帮助。我不需要筛选大量的理论术语,也不需要破译数百个灰度流程图,而可以直接进入问题的核心,并理解如何使用数据科学,来解决我作为数据科学家在日常工作中面临的各种问题。

例如,前几天,我正在寻找一些关于 A/B 测试的信息,这是数据科学中一个常见的框架,而我个人对此没有什么经验。我在网上找到了很多还不错的文章,然后在 Netflix 的科技博客上偶然发现了一个精彩的系列。这个系列不仅回答了我关于 A/B 测试的问题,还有很多关于“如何在 Netflix 使用 A/B 测试”的实际例子。这对理解理论和实践都有极大的帮助。

2. 开始在线写作

打开网易新闻 查看更多图片

Image by Daniel Thomas on Unsplash

我开始在 Medium 上写作的主要原因之一,是为了帮助自己学习。

没错,不是为了教学或营销,而是为了学习。

人们常说,你能记住自己所读内容的 10%,能记住你所看到内容的 20%,以及你所教授内容的 95%。如果你完全依赖于阅读别人的博客,就不太可能获得知识的全部价值,或记住自己正在阅读的所有信息。自己动手写数据科学博客是巩固这些知识并加强所学内容的绝佳方式。这迫使你一步一步地思考问题,并帮助自己对主题有更深的理解。

如果在线写作的想法听起来有点超出你的舒适区,不要担心。我也有同样的感觉。但问问你自己:可能发生的最坏情况是什么?就我而言,我发现最糟糕的结果可能是被我的同事轻微地取笑一下。总的来说,我认为这些后果还能承受,而如果考虑到能从写作中获得的经验,就会发现写作是非常值得的。如果你不知道该写些什么,可以看看 Towards Data Science 的 FAQ 页面上的一些建议。

3. 订阅 TLDR AI Newsletter

阅读和撰写博客是了解数据科学和人工智能最新技术发展的好方法,但如果你想跟进商业方面的发展,我建议你订阅以人工智能为重点的 newsletter,这些 newsletter 可以让你跟踪初创公司、收购和研究趋势。

我个人最喜欢的是 TLDR AI Newsletter。他们会每天发送一封电子邮件,总结行业中的关键新闻故事,而且这比他们更成熟的技术通讯更有针对性。类似的产品还包括 MIT Technology Review 的 The Download 和 DeepLearning.AI 的 The Batch。我喜欢这样newsletters,因为通常它们只需要我花 2 分钟的时间来阅读,却能帮助我快速了解 AI 世界的事情。

4. 关注“ML Papers of the week” GitHub repo

DAIR.AI 维护着一个很棒的 GitHub repo,每周都会更新 10 篇新的机器学习论文。对于每篇论文,DAIR 都会提供一个简短的总结,并链接到一条 Twitter 上,解释更多关于论文的发现。如果你不想看 GitHub repo,也可以在 Twitter 上关注 DAIR.AI。

图片来源:Medium

就我个人而言,我发现这些简短的总结要比你从 Google Scholar 或 arXiv 等服务中得到的知识操作性更强。在 Google Scholar 和 arXiv 上,你很快就会被大量知识淹没,最终会因为“信息过载”而毫无收获。DAIR.AI 的伟大之处在于,他们为你做了大量的工作,筛选出了最有趣和最前沿的论文,并可以让你选择继续阅读,或者果断放弃、继续前进。

5. 在 YouTube 上订阅 Data Science 频道

Two Minute Papers 是一个 YouTube 频道,该频道每周都会上传两个新视频,每个视频的目的都是提炼最近一篇研究论文的发现,其中许多都是关于人工智能的。在我写这篇文章的时候,他们的人工智能和深度学习播放列表中已经有将近 500 个视频。

订阅这个频道是了解人工智能研究最新发展的好方法。我特别喜欢他们的经典视频“OpenAIPlays Hide and Seek”,但老实说,有太多精彩的视频了,很难选择。

另外两个我特别喜欢的频道是 Josh Starmer 的 StatQuest 和 3Blue1Brown。我喜欢这些频道,是因为它们以一种非常直观和易懂的方式,来解释统计学和机器学习的概念,而不需要有大量的基础知识。虽然这些频道最出名的是入门课程,但他们也发布了很多关于机器学习前沿话题的视频,例如 3Blue1Brown 最近关于卷积的介绍。

6. 参加网络研讨会和午餐学习会

许多组织都会举办免费的网络研讨会,讨论数据科学和人工智能领域的最新创新。就我个人而言,我是这些网络研讨会的忠实粉丝,因为预约网络研讨会迫使我腾出时间来学习和提升自己,这对确保学习时间非常有帮助。

例如,如果你在日常工作中使用 Google BigQuery 或 AWS RDS 等云数据库系统,那么你可能会受益于参加由 Google 或 AWS 主办的网络研讨会,讨论如何最大限度地利用这些工具。我最近参加了一个这样的网络研讨会(一个很棒的 BigQuery 网络研讨会),主题是优化 SQL 代码。

7. 在 Twitter 上关注一些 AI 大佬

如果你像我一样,很容易迷失在许多 AI 新闻稿和技术文档页面的技术细节中,那么 Twitter 是一个很好的地方,在这里你可以从专家那里读到很多坦率的意见和建议。我特别推荐关注 Yann LeCun,Timnit Gebru,Geoffrey Hinton,Andrew Ng 和 Christopher Manning 等人。像他们这样的人工智能研究人员会使用 Twitter 来分享他们工作的进展,并分享一些不一定能进入科学论文但却很有用的“花边研究”。

图片来源:Medium

然而,我喜欢 Twitter 的主要原因是,它是关注数据科学家和人工智能从业者在工业界工作(而不仅仅是研究)的一个好方法。比如像 Chris Albon,Jay Alammar 和 Cassie Kozyrkof 这样的人研究的问题,与在业内工作的数据科学家的日常生活息息相关,关注这些大佬是了解其他数据科学组织所做工作的好方法。

还有一点是,Twitter 比 arXiv 更具幽默感。

打开网易新闻 查看更多图片

Twitter 上的 AI Memes

8. 总结

如果你想在这个数据科学领域建立自己的职业生涯,那么了解人工智能和数据科学的最新趋势绝对是至关重要的。

然而,根据经验,我发现自己很容易被特定任务的细节所吸引,而忽略整个行业的发展趋势。在这篇文章中,我的目的是强调那些能够帮助我在日常工作中跟上最新趋势和发现创新机会的策略。如果你认为我漏掉了什么精华,请在评论中告诉我,期待听到大家的建议。

译者:Jane

编辑:主观视角

来源:神译局