本文精選了過去一個月內全球機器學習和AI領域的10篇熱門報道,內容既包括算法和技術上的突破,也有獨樹一幟的觀點和建議,還涵蓋一些名校的AI課程資源和資料,值得AI愛好者和從業者收藏參考借鑒。
1、OpenAI的技術可能讓大規模生成以假亂真的假新聞
OpenAI訓練了一個神經網絡,卻不愿意共享。為什么?這個神經網絡能夠憑借單個句子中生成完全的假新聞。換句話說,這可能成為批量生成假新聞的一種工具。
本文介紹了OpenAI訓練神經網絡時獲得的結果,給出了用該網絡預測超過40GB文本的下一個單詞時的結果,結果很理想,但問題是:如果這些技術落入壞人之手怎么辦?
OpenAI決定不與分享這些結果,理由是“這些成果可能成為對此類問題擔憂的早期開端”。確實,這是一個既存在潛在威脅,又容易被大部分人接觸到的案例。而且我認為,這個決定絕對是邁向負責任的人工智能技術的一步。
文章鏈接:
https://openai.com/blog/better-language-models/
2、如何發現假新聞的內在模式?
目前,對抗假新聞成為越來越重要的話題。本文介紹了利用AI“去偽存真”的技術和所面臨的障礙。
目前,在一些特定的障礙中,由文章主題頻率引起的偏差是最重要的。事實上,包含“特朗普”或“克林頓”的詞語更可能是假新聞。訓練神經網絡以便他們能夠有效地執行未知主題是這里的真正挑戰。
本文推廣了一個重要的主題,在我看來,每個人都應該對此引起重視。
文章鏈接:
https://news.mit.edu/2019/opening-machine-learning-black-box-fake-news-0206
3 、為什么將數據科學應用在生產領域這么困難?
如果企業能夠有效地將數據科學成果融入現有業務流程,那么數據科學可以為公司帶來真正的價值。這就是作者的觀點,他在文章中解釋了為什么數據科學很難實現高效應用。
數據科學對資源方面要求很高,因此,開發人員和運營部門必須共同努力,快速為客戶帶來穩定的新功能。在我看來,打破工作團隊中的孤島效應,并讓整個公司參與自動化決策主題達成這一目標的必要條件。
此外,作者關于IT基礎設施部署效率問題的表述是在生產領域成功應用數據科學的關鍵。
文章鏈接:
https://www.datascience.com/blog/why-is-it-so-hard-to-put-data-science-in-production
4、數據科學的職業內容已經不像你想的那樣了!
這篇文章行文直截了當。現在,人們常常對數據科學家的日常工作存在某些誤解。澄清這一問題,對于目前在剛剛在該領域邁入職業生涯的大量年輕數據科學家來說是尤為重要事情。你們想錯了!對于數據科學家而言,僅僅掌握一些最先進的算法是不夠的。
不過,解決這個問題仍然有希望!這篇文章就給出了掌握數據行業以及作為數據科學家必備的技能。我真的很喜歡作者對工作的誠實態度。天下沒有免費的午餐,所以你需要努力工作和耐心。
然而,通過逐一處理真正的問題,你的進步可能比你想象的要快。 “永遠不要讓炒作壓倒你。”
文章鏈接:
https://veekaybee.github.io/2019/02/13/data-science-is-different/
5、利用機器學習提升風能發電的價值
“渦輪機的成本已經大幅下降,使用率也已經大幅上升”。所以,DeepMind目前提高風力發電價值的條件已經初步成熟。為了實現這個目標,深度學習可能會大展身手。
利用深度學習算法,準確預測風力和風向,可以讓渦輪機所有者優化在電網中的部署情況。然后,根據預測結果做出的規劃越細致,單位風能所能創造的價值就越多。
這篇文章簡潔而高效,文中給出了DeedMind的機器學習算法讓風力發電實現增值的不同步驟和背景,提出了鮮明的論點。這里要給無碳技術點個贊!
文章鏈接:
https://deepmind.com/blog/machine-learning-can-boost-value-wind-energy/
6、深入研究并了解神經網絡的工作原理
本文的基礎是另一篇展示神經網絡的文章,該網絡可以生成美麗的顏色組合。在他重現他在互聯網上發現的一篇文章中,作者遇到了導致圖像質量不佳的幾個問題。
因此,他在本文中介紹了自己解決這個問題的一些步驟,并提供了一些中間結果和假設。
Jupyter Notebook提供了構建自己的神經網絡并改進網絡性能的一些指導意見,從現在開始,你就是藝術家了!
文章鏈接:
https://towardsdatascience.com/making-deep-neural-networks-paint-to-understand-how-they-work-4be0901582ee
7、利用TensorFlow代碼示例介紹深度學習
對于想要開始使用TensorFlow的人來說,這篇文章是必讀的。作者討論了從MLP到深度強化學習的7種架構范例,最重要的是,提供了實現其中每一種的代碼示例。
本文以非常清晰和教學化的方式介紹了MIT深度學習的課程材料。
文章鏈接:
https://medium.com/tensorflow/mit-deep-learning-basics-introduction-and-overview-with-tensorflow-355bcd26baf0
8、AlphaStar:《星際爭霸II》制霸之路
近年來,視頻游戲迅速成為機器學習算法的熱門領域。 《星際爭霸》成為眾人矚目的焦點,這是一款非常成功且極具挑戰性的游戲。對算法而言,難點包括非完全信息、需要短期和長期戰略的組合,行動指令和行動效果之間存在延遲等。
本文首先簡要描述了學習階段使用的神經網絡,然后通過可視化和交互式原理圖詳細介紹了網絡學習路徑。
此外,將AlphaStar的AI的游戲方式與真實玩家的游戲方式進行比較真的很有趣。可以看到,算法在一些有趣的領域中超越了人類玩家水平,如APM、多線操作等。
文章鏈接:
https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/
9、給神經網絡做個“顯微手術”
本文介紹了一個簡單但很棒的想法,可以手動修復有偏見的神經網絡。
MIT的研究人員研究了一種工具(NeuroX),對受過語言翻譯訓練的神經網絡的神經元進行排序。此排名的目標是衡量每個神經元在翻譯過程中的重要程度。
消融一個重要的神經元會大大降低網絡的性能,而消融一個不那么重要的神經元幾乎對性能沒有什么影響。在對抗網絡訓練中的偏見時,這個工具的作用更加具體。它試圖找出排名最高與識別性別有關的排名最高的神經元,然后:祝賀,你的神經網絡不再有性別歧視了!
文章鏈接:
http://news.mit.edu/2019/neural-networks-nlp-microscope-0201
10、優步的數據工作流程的規模化管理
優步公司每天生成的原始數據量超過100PB。因此,公司需要能夠在運營團隊和機器學習工程師之間共享可靠、可擴展、可維護的系統。為此,優步開發了Piper,這是一款集中式工作流程管理系統。
本文清楚地介紹了優步對此工具進行的迭代改進,相信這些改進應該會引發任何應用數據系統的人的濃厚興趣。
-
神經網絡
+關注
關注
42文章
4812瀏覽量
103289 -
機器學習
+關注
關注
66文章
8499瀏覽量
134396 -
數據科學
+關注
關注
0文章
168瀏覽量
10449
原文標題:【Medium精選】全球十大AI熱文,OpenAI“假新聞”首當其沖
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
【「零基礎開發AI Agent」閱讀體驗】+ 入門篇學習
【「零基礎開發AI Agent」閱讀體驗】+初品Agent
**【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**
人工智能和機器學習以及Edge AI的概念與應用

AI技術驅動半導體產業升級,芯原布局未來智能計算領域
AI干貨補給站 | 深度學習與機器視覺的融合探索

評論