女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌用神經網絡根據筆畫生成漢字,新造了一系列“假漢字

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-06-25 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你永遠不知道漢字的潛力。谷歌大腦東京分部的研究員hardmaru,用神經網絡根據筆畫生成漢字,新造了一系列“假漢字”。你別說,有些看上去還真像那么一回事。

因為我們都是中國人,從小看著漢字、寫著漢字長大,所以已經忘記了漢字本身是一件多么困難的事情。

是的,漢字基本的筆畫就只有點橫撇捺等幾種,但是,中國文字從甲骨文、金文、篆書、隸書一路走來,不同程度存在難寫難認的缺陷。就算只是一個“點”,在不同的字里面,這個點的大小和方向也是各不相同。因此,對于漢字設計師來說,可是要了老命。

調查記者 Nikhil Sonnad 曾經在 QZ 發表過一篇文章,詳細講述了設計一個漢字字體漫長艱苦而又令人沉迷的過程。其中有這樣一個例子,展示了言字旁在不同的文字中擁有不同的大小和方向:

言字旁在不同的文字中擁有不同的大小和方向。來源:QZ

這也是為什么相比五花八門的英文和阿拉伯數字字體,漢字的字體那么少的一個原因。

Nikhil Sonnad 在那篇文章中指出,一位經驗豐富的設計師可以在6個月的時間里設計一種涵蓋幾十種西方語言的新字體。但是,對于單個中文字體,至少需要一個好幾人的設計師團隊兩年以上的時間。

有沒有什么好的方法能夠解決這個問題?

作為新智元(ID:AI_era)的讀者,或許有人已經猜到我們接下來會說什么。是的,還是神經網絡。

谷歌大腦東京分部的研究人員hardmaru,使用神經網絡生成漢字,但他與眾不同的地方在于,由于提供給神經網絡的數據是“筆畫”,因此生成的是所有理論上可以存在,但現實中并沒有在使用的漢字。

或許你要說,這樣做有什么用,但仔細看就能發現作者這樣做在理論和實際上的意義。

漢字這個系統本質上是開放的。使用可用的元素(偏旁部首、筆畫等等),可以制作出無數個不同的字符。雖然代碼目前還不能很準確地定位筆畫的位置,但hardmaru實驗中的一些結果,看起來非常像真實存在的漢字。

認識一個字不一定寫得出,但寫得出就一定認識它

在一篇介紹他的這項工作的博客中,hardmaru表示,他從小也被父母硬逼著去學漢字,雖然他周圍的人大多說英語。老師教他寫漢字的過程就是抄寫聽寫抄寫聽寫的不斷循環,就好像LSTM根據訓練樣本輸出序列結果一樣。

另一方面,他也注意到,“寫”漢字和“讀”漢字是兩個非常不同的過程。你認識一個字(能夠閱讀或者發出讀音),但不一定寫得出來;但是,如果你能寫出一個漢字,你一定知道它的發音?,F在,人們越來越多的依賴基于發音的輸入法來“寫”漢字,當真正提筆寫字的時候,常常會出現忘記怎么寫的情況。

在一定程度上,機器學習的過程也一樣,最初都是從簡單的分類問題開始:判斷輸入的圖像是貓還是狗,交易是真實的還是是欺詐……這些任務非常有用。但是,hardmaru認為,更有趣的任務是生成數據,在hardmaru看來,生成數據是數據分類的延伸和擴展。相比能夠認出某個漢字,能夠把這個漢字寫出來表明我們對這個漢字有更多的理解。同理,生成內容也是理解內容的關鍵。

生成對抗網絡(GAN)在生成數據方面有著優異的表現,機器翻譯也算是一類生成數據的例子。但hardmaru想生成的是矢量數據。因為他認為很多內容都更適合用矢量的形式來表達,比如用數碼筆畫的素描、CAD設計、科學實驗數據等等。

字體和筆畫也更適合用矢量來表示。精心設計的TrueType字體,不管大小,顯示出來都很美麗。

用 Sketch-RNN 新造一本《新華字典》

接下來,我們將介紹hardmaru如何使用RNN生成矢量格式的手寫體漢字。漢字以矢量保存(SVG格式)。

hardmaru實現的是一個生成“新造”漢字的網絡sketch-rnn,與Graves手寫體生成模型框架(見下)類似。

pIYBAFswZa-AC7lZAABnOqgnzvc030.png

用于訓練的數據是真實的漢字,并且包含了筆畫順序。因此,神經網絡生成的漢字看上去也是按照一定程度上合理的筆畫順序來的。

訓練數據樣本,不同的顏色代表了筆畫順序,來源于KanjiVG數據集

在sketch-rnn中,每一筆都用類似筆畫的數據建模,其中每一步數據都包含x和y軸的偏移量,以及這一筆是落在紙上還是沒有落在紙上,如果落在紙上,那么上一筆和這一筆之間就會有連線。神經網絡必須為下一步提供概率分布。這個概率分布不是離散的,而是連續分配x軸和y軸上的偏移量,以及筆在下一步在紙上抬起的概率(也即筆畫結束的概率)。sketch-rnn使用混合高斯分布來估算下一筆的位移。這個用來生成筆跡的方法叫做混合密度網絡(Mixture Density Networks,MDN)。

pIYBAFswZa-AZ0zeAABh2UgVHRQ561.png

以上是使用混合高斯密度來生成漢字筆劃的一個例子。黑點代表在寫字過程中連起來的線,LSTM + MDN算法將持續估計下一個點出現位置的概率分布。這個分布被建模成混合高斯分布。這意味著下一個位置是許多不同位置的混合(深淺不同的紅色橢圓),并且每個位置本身都是x軸和y軸偏移的二維聯合高斯分布,每個偏移都有自己的位置2×2協方差矩陣。

MDN軌跡展示

除了筆劃的位置分布和結束概率之外,還需要對寫完整個漢字的概率進行建模,也即結束字符“end-of-char”概率。但是,每個筆畫完結的概率跟整個漢字完結的概率有一定重復,hardmaru 花了不少功夫嘗試對上述兩個信號(筆劃完結概率、字符完結概率)建模。最終,他通過神經網絡中的softmax層將筆的狀態建模為一組離散的狀態。筆的狀態分為三種:筆畫結束、字符結束、落筆。模型會計算每一步三種狀態的概率。

LSTM+MDN基本上是LSTM+Softmax的擴展,hardmaru以后想嘗試更強大的方法。GAN(生成對抗網絡)也許能應用到循環網絡上,但他預計訓練LSTM GAN會非常困難。

除了上面展示的各種例子,這是已有的一些有趣的結果,hardmaru自己做了“注釋”:

還有一些不知道怎么描述的結果:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    107904
  • 神經網絡
    +關注

    關注

    42

    文章

    4812

    瀏覽量

    103278
  • 機器學習
    +關注

    關注

    66

    文章

    8499

    瀏覽量

    134391

原文標題:谷歌大腦研究員玩轉漢字RNN:神經網絡生成新華字典

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工神經網絡原理及下載

    人工神經網絡根據人的認識過程而開發出的種算法。假如我們現在只有些輸入和相應的輸出,而對如何由輸入得到輸出的機理并不清楚,那么我們可以把輸入與輸出之間的未知過程看成是
    發表于 06-19 14:40

    【PYNQ-Z2試用體驗】神經網絡基礎知識

    能在外界信息的基礎上改變內部結構,是種自適應系統,通俗的講就是具備學習功能?,F代神經網絡種非線性統計性數據建模工具。簡單來說,就是給定輸入,神經網絡經過
    發表于 03-03 22:10

    卷積神經網絡如何使用

    卷積神經網絡(CNN)究竟是什么,鑒于神經網絡在工程上經歷曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發表于 07-17 07:21

    【案例分享】ART神經網絡與SOM神經網絡

    今天學習兩個神經網絡,分別是自適應諧振(ART)神經網絡與自組織映射(SOM)神經網絡。整體感覺不是很難,只不過些最基礎的概念容易理解不
    發表于 07-21 04:30

    如何構建神經網絡

    原文鏈接:http://tecdat.cn/?p=5725 神經網絡種基于現有數據創建預測的計算系統。如何構建神經網絡?神經網絡包括:輸入層:
    發表于 07-12 08:02

    卷積神經網絡模型發展及應用

    網絡 GhostNet。由于卷積神經網絡一系列突破性研究成果, 并根據不同的任務需求不斷改進,使其在目標檢測、 語義分割、自然語言處理等不同的任務中均獲得了 成功的應用。基于以上認識
    發表于 08-02 10:39

    漢字Unicode碼生成軟件

    漢字Unicode碼生成軟件
    發表于 03-15 12:35 ?53次下載
    <b class='flag-5'>漢字</b>Unicode碼<b class='flag-5'>生成</b>軟件

    基于BP神經網絡的電路最優測試集的生成設計

    BP 神經網絡是目前用于模擬電路故障診斷的神經網絡。本文應用BP 神經網絡完成了實際電路最優測試集的生成設計,驗證
    發表于 12-16 16:08 ?9次下載

    基于概率神經網絡的手寫漢字識別方法

    的結構特征,即是由偏旁部首組成,且漢字的數量龐大,兇此漢字識別有著必然的困難性和復雜性。鑒于光學字符識別系統OCR主要對印刷體漢字有著良好的識別能力:漢字識別方法有很多種,近年來,新的
    發表于 11-07 11:50 ?17次下載
    基于概率<b class='flag-5'>神經網絡</b>的手寫<b class='flag-5'>漢字</b>識別方法

    【人工神經網絡基礎】為什么神經網絡選擇“深度”?

    的 Logistic regression 就可以認為是個不含隱含層的輸出層激活函數 sigmoid(logistic) 的神經網絡,顯然 Logistic regression 就不是 deep 的。不過,現在
    發表于 09-06 20:48 ?815次閱讀

    漢字字庫提取程序漢字生成器應用程序免費下載

    本文檔的主要內容詳細介紹的是漢字字庫提取程序漢字生成器應用程序免費下載。
    發表于 05-06 16:16 ?46次下載
    <b class='flag-5'>漢字</b>字庫提取程序<b class='flag-5'>漢字</b><b class='flag-5'>生成</b>器應用程序免費下載

    lcd漢字生成軟件工具免費下載

    用于生成小LCD漢字點陣
    發表于 11-27 16:45 ?3次下載

    Python從頭實現神經網絡來理解神經網絡的原理2

    有個事情可能會讓初學者驚訝:神經網絡模型并不復雜!『神經網絡』這個詞讓人覺得很高大上,但實際上神經網絡算法要比人們想象的簡單。 這篇文章完全是為新手準備的。我們會通過Pytho
    的頭像 發表于 02-27 15:06 ?840次閱讀
    <b class='flag-5'>用</b>Python從頭實現<b class='flag-5'>一</b>個<b class='flag-5'>神經網絡</b>來理解<b class='flag-5'>神經網絡</b>的原理2

    Python從頭實現神經網絡來理解神經網絡的原理3

    有個事情可能會讓初學者驚訝:神經網絡模型并不復雜!『神經網絡』這個詞讓人覺得很高大上,但實際上神經網絡算法要比人們想象的簡單。 這篇文章完全是為新手準備的。我們會通過Pytho
    的頭像 發表于 02-27 15:06 ?991次閱讀
    <b class='flag-5'>用</b>Python從頭實現<b class='flag-5'>一</b>個<b class='flag-5'>神經網絡</b>來理解<b class='flag-5'>神經網絡</b>的原理3

    卷積神經網絡模型原理 卷積神經網絡模型結構

    卷積神經網絡模型原理 卷積神經網絡模型結構? 卷積神經網絡種深度學習神經網絡,是在圖像、語音、文本和視頻等方面的任務中最有效的
    的頭像 發表于 08-21 16:41 ?1361次閱讀
    主站蜘蛛池模板: 福清市| 孟津县| 卢湾区| 禄劝| 海城市| 定南县| 勃利县| 自治县| 炎陵县| 同江市| 兰西县| 东至县| 惠来县| 五指山市| 上虞市| 桓仁| 高尔夫| 故城县| 兴城市| 阿拉善左旗| 遵义市| 太白县| 基隆市| 安吉县| 江油市| 鄱阳县| 宁乡县| 灵武市| 明光市| 灵川县| 伊吾县| 铜鼓县| 盐源县| 北川| 和林格尔县| 南乐县| 固原市| 大港区| 观塘区| 龙口市| 启东市|