女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何建立真正的數(shù)據(jù)目錄

IBM中國 ? 來源:IBM中國 ? 作者:IBM中國 ? 2022-01-20 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者簡介:王積杰目前擔任IBM數(shù)據(jù)與AI產(chǎn)品線大中華區(qū)信息架構產(chǎn)品總監(jiān),對AI和信息架構有深刻的理解和認識。擁有20多年的IT從業(yè)經(jīng)驗,從2008年起擔任IBM公司大中華區(qū)數(shù)據(jù)治理產(chǎn)品線產(chǎn)品總監(jiān),多年從事企業(yè)數(shù)據(jù)集成和治理的工作。對ETL,實時數(shù)據(jù)集成,數(shù)據(jù)治理,數(shù)據(jù)質(zhì)量管理和元數(shù)據(jù)管理和數(shù)據(jù)目錄都頗有造詣。

數(shù)據(jù)治理已經(jīng)發(fā)展了 20 多年,從最早的元數(shù)據(jù)管理,到后來的數(shù)據(jù)質(zhì)量管理,很多企業(yè)多年前都建設了名為數(shù)據(jù)治理的項目。但是,如果你去問這些企業(yè),數(shù)據(jù)治理項目做得怎么樣?發(fā)揮了怎樣的業(yè)務價值和效益?你得到的答案往往不盡人意。很多企業(yè)建設好數(shù)據(jù)治理項目以后,就荒廢了沒有人使用。為什么會造成這樣的情況呢?究其原因是,其數(shù)據(jù)治理項目只是面對 IT 人員的,并不是面對業(yè)務人員的。如果一個項目不是面對業(yè)務人員的,就難以發(fā)揮業(yè)務價值,業(yè)務人員無法使用,往往是不可能獲得成功的。因此,近年來,國外興起了建設數(shù)據(jù)目錄的熱潮,不只是談數(shù)據(jù)治理,而是為了解決面向業(yè)務人員并體現(xiàn)業(yè)務價值的問題。數(shù)據(jù)目錄就是為了幫助業(yè)務人員以及數(shù)據(jù)科學家,解決尋找數(shù)據(jù)、了解數(shù)據(jù)、優(yōu)化數(shù)據(jù)以及使用數(shù)據(jù)的難題。

什么是數(shù)據(jù)目錄?

很多人還不清楚什么是數(shù)據(jù)目錄,我來打個比方,我們用書來比喻數(shù)據(jù)。大家都知道圖書館的圖書目錄,我們過去進到圖書館借書,首先就要去查找圖書目錄。如果一個圖書館那么亂的話,相信就連圖書管理員也無法找到想要的書吧?如果一個企業(yè)的數(shù)據(jù)庫管理得那么亂,那么就連數(shù)據(jù)庫管理員可能也無法找到數(shù)據(jù)了。如果一個圖書館 右上角那樣的話,那說明這個圖書館的書,已經(jīng)分門別類擺放整齊了,就像一個企業(yè)的數(shù)據(jù),結構化的和非結構化的,都分別在數(shù)據(jù)庫里或大數(shù)據(jù)平臺上,放得整整齊齊了。

但是,對于圖書館來說,其主要任務是為讀者服務的,書擺放得整齊,需要借書的讀者就能借到他要的書嗎?我們都知道,那是不夠的,因為缺少一個圖書目錄,就是左邊的小抽屜。那個小抽屜里放的是一張一張的書卡,書卡上寫了一些什么呢?往往有書的名字、書的簡介、書的作者、書的出版年份,還有書的類別,比如是物理類的還是化學類的;書的屬性,比如是工具書類的還是文藝書類的;書適合的年級,比如一年級還是三年級;最重要的是書的具體位置,它是在圖書館的哪一排的哪一層的哪一格里。有了這張書卡,我們就可以輕松地找到這本書并借到這本書了。我曾經(jīng)和一個大型企業(yè)的 CIO 聊天,這家企業(yè) 20 年前就建了數(shù)據(jù)倉庫,十年前又建了大數(shù)據(jù)平臺和數(shù)據(jù)湖,類似數(shù)據(jù)治理的項目都建設過好幾期了。我問 CIO 最近企業(yè)在IT方面開展什么項目呢?CIO 回答,最近招進了好幾個數(shù)據(jù)科學家,打算開展AI項目的建設,但是遇到了困難。數(shù)據(jù)科學家們在工作中,要花 70% 以上的時間在尋找數(shù)據(jù),而不是 AI 建模。CIO 問,為什么我們過去的數(shù)據(jù)治理項目,幫不了這些數(shù)據(jù)科學家呢?我就告訴這個 CIO, 你們過去的數(shù)據(jù)治理項目,都是面向IT用戶的,不是面向業(yè)務人員的。如果你真的要幫助數(shù)據(jù)科學家方便快捷地找到他們要的數(shù)據(jù),你就要建設真正的數(shù)據(jù)目錄。

建立數(shù)據(jù)目錄的業(yè)務準備

要建立真正的數(shù)據(jù)目錄,前期還是要做好一些業(yè)務方面的準備工作的,就像建一張書卡一樣,書卡上的內(nèi)容,你先要準備好。數(shù)據(jù)目錄一般有這樣一系列的業(yè)務域的元素:

01數(shù)據(jù)分類(Categories)

這是從業(yè)務角度,對業(yè)務數(shù)據(jù)的分類。就像圖書館里的書,按物理、化學、生物、醫(yī)學來分類一樣。企業(yè)里可以按分公司或部門來分類,也可以按業(yè)務類型來分類,如:銷售類、生產(chǎn)類、財務類等等。

02業(yè)務術語(Terms)

業(yè)務術語就有點像書卡上的書名了,讀者根據(jù)書名來找書,那么數(shù)據(jù)科學家們往往也是根據(jù)業(yè)務術語來找他要的數(shù)據(jù)。比如:VIP客戶、日產(chǎn)量、月產(chǎn)量等。也可以是一些業(yè)務的指標和維度。

03政策 (Policies)

大到國家小到企業(yè),都有很多政策,會影響數(shù)據(jù)的性質(zhì)和使用。比如:個人數(shù)據(jù)的隱私保護,歐盟有 GDPR,中國也出臺了《個人信息保護法》,對個人信息我們需要打上隱私標簽,進行保護,不能隨意泄露。

04規(guī)則(Rules)

數(shù)據(jù)都有規(guī)則,有的是業(yè)務規(guī)則,有的是數(shù)據(jù)質(zhì)量規(guī)則。比如:身份證號碼,它的規(guī)則是18位的數(shù)字,前6位代表地區(qū),中間8位代表生日,后三位是序號,最后一位是校驗碼。有些物料的號碼,第一位是字母代表材質(zhì),后四位數(shù)字代表序列等等。

05參考數(shù)據(jù)(Reference Data)

有些數(shù)據(jù)是代碼,需要通過參考數(shù)據(jù)來知道真正的數(shù)值。

06數(shù)據(jù)分級(Classification)

就像書卡上會告訴你這本書是給一年級用的還是給四年級用的,數(shù)據(jù)也是需要分級的。比如:第一級的數(shù)據(jù)屬于公開數(shù)據(jù)大家都可以看,第二級的數(shù)據(jù)只有部門經(jīng)理才能看,第三級的數(shù)據(jù)是給高層領導看的,第四級數(shù)據(jù)只有董事會的成員才能看等等。

07數(shù)據(jù)類型(Data Class)

我們可以對數(shù)據(jù)根據(jù)它的類型進行分類,比如:姓名、地址、電話、身份證號碼,或者是產(chǎn)品代碼、產(chǎn)品種類或是產(chǎn)量信息等等。我們需要對Data Class的類型進行定義,比如通過正則表達式。Watson Knowledge Catalog 將可以通過AI的方式,根據(jù)Data Class的定義,自動的進行數(shù)據(jù)的分類和識別。

建立數(shù)據(jù)目錄的技術難點

數(shù)據(jù)目錄的實現(xiàn)其實并不容易,否則,為什么那么多年來,大多數(shù)的客戶還是在普通的數(shù)據(jù)治理層面,僅能夠面向技術人員,而不能面向業(yè)務人員呢?原因是:一個企業(yè)的業(yè)務域元素可能有幾萬個,而技術域的元數(shù)據(jù)可能有幾十萬個,幾萬個與幾十萬個的對應關系,可比圖書館的書卡制作要復雜得多了。幾千本書你可以通過書卡,用人工的方法一一對應。但幾萬個業(yè)務域元素和幾十萬個技術元數(shù)據(jù)的對應,全部要靠手工來實現(xiàn),幾乎是不可能完成的任務。這也是這么多年來,數(shù)據(jù)目錄沒有很快發(fā)展起來的原因,直到最近AI技術機器學習技術的引進,才幫助我們解決了這個問題——針對這個難題,IBM推出了Watson Knowledge Catalog。 Watson是IBM 響當當?shù)腁I名片,所以Watson Knowledge Catalog里,采用了大量的IBM企業(yè)級AI和機器學習的技術,來幫助我們實現(xiàn)從業(yè)務到技術的關聯(lián)。

展示了數(shù)據(jù)目錄各個元素之間的關系。其中,從業(yè)務術語到數(shù)據(jù)資產(chǎn)的那個紅色的箭頭,一直是數(shù)據(jù)目錄建設的難點。直到 IBM 采用了大量的AI和機器學習的方式,來幫助做自動的關聯(lián),才解決了這個問題。如果業(yè)務元數(shù)據(jù)或者 Data Class 定義了清晰的數(shù)據(jù)規(guī)則,那么,Watson Knowledge Catalog 就可以應用AI的能力,進行自動關聯(lián)。如果并沒有定義清晰的規(guī)則,那么,我們可以用人工的方式,手工地進行關聯(lián),同時 Watson Knowledge Catalog 會進行機器學習,自動建立規(guī)則。當你用手工多關聯(lián)幾次,自動建立的規(guī)則越來越完善以后,系統(tǒng)就能通過AI實現(xiàn)自動關聯(lián)了。

建立數(shù)據(jù)目錄的技術準備

建立數(shù)據(jù)目錄,我們要了解企業(yè)內(nèi)部都有哪些數(shù)據(jù)?這些數(shù)據(jù)在哪里?數(shù)據(jù)質(zhì)量狀況是如何的?這些都可以使用 Watson Knowledge Catalog 的數(shù)據(jù)自動發(fā)現(xiàn)功能去實現(xiàn)。Watson Knowledge Catalog 會自動地發(fā)現(xiàn)數(shù)據(jù),自動地連接數(shù)據(jù)源,并導入元數(shù)據(jù)。它還可以自動地分析數(shù)據(jù)的質(zhì)量狀況,進行數(shù)據(jù)質(zhì)量的打分,并形成數(shù)據(jù)質(zhì)量的圖表或儀表盤。數(shù)據(jù)質(zhì)量的打分,可以利用已經(jīng)定義的數(shù)據(jù)質(zhì)量規(guī)則,也可以允許業(yè)務人員用拼圖的方式,自定義數(shù)據(jù)質(zhì)量規(guī)則。這種定義方式有點像拼圖游戲,數(shù)據(jù)科學家可以用一些簡單的規(guī)則如大于、小于、等于、AND、OR、包含、不包含等,自己拼出數(shù)據(jù)質(zhì)量規(guī)則, 并運行,幾分鐘就可以得到數(shù)據(jù)質(zhì)量的報告。過去,數(shù)據(jù)科學家拿到一批數(shù)據(jù),為了要了解其數(shù)據(jù)質(zhì)量,往往要把需求提給IT部門,IT 部門還要請軟件開發(fā)商來寫程序,從而分析這批數(shù)據(jù)的數(shù)據(jù)質(zhì)量。從數(shù)據(jù)科學家提出需求,到拿到數(shù)據(jù)質(zhì)量報告,有的時候要幾周時間。這與我們目前的高效快節(jié)奏的社會完全不匹配。而如果數(shù)據(jù)科學家用拼圖方式,花 5 分鐘定義數(shù)據(jù)質(zhì)量規(guī)則,然后執(zhí)行它,15 分鐘后,就能得到結果了。這種自助式的數(shù)據(jù)質(zhì)量探索能力,往往是數(shù)據(jù)科學家最希望的。

另外,元數(shù)據(jù)管理和血緣分析,也是數(shù)據(jù)目錄不可或缺的功能,他可以幫助數(shù)據(jù)科學家了解每一個數(shù)據(jù)從哪里來,到哪里去,從而更好地理解業(yè)務。

數(shù)據(jù)目錄的使用

本文開頭就提到,數(shù)據(jù)目錄建設的目的,是為了解決業(yè)務人員和數(shù)據(jù)科學家們發(fā)現(xiàn)數(shù)據(jù)和使用數(shù)據(jù)的難題。那么,為數(shù)據(jù)科學家和業(yè)務人員提供一個友好的數(shù)據(jù)發(fā)現(xiàn)和使用的界面就尤為關鍵了。Watson Knowledge Catalog 可以將數(shù)據(jù)目錄,展示成一個知識圖譜。業(yè)務人員可以既通過類似 Google 的方式,通過搜索業(yè)務詞匯,找到他需要的數(shù)據(jù),也可以通過基于知識圖譜的發(fā)現(xiàn)和探索,很方便地圖形化地找到他要的數(shù)據(jù),并且可以自助地獲取這些數(shù)據(jù)。Watson Knowledge Catalog 自帶有數(shù)據(jù)隱私保護的功能。如果某個數(shù)據(jù)已經(jīng)被打上了隱私保護的標簽,那么你就看不到這些數(shù)據(jù),這些數(shù)據(jù)會被打上星號或者漂白后再展示。數(shù)據(jù)科學家獲得了他要的數(shù)據(jù)后,還可以自助地優(yōu)化這些數(shù)據(jù)或者利用 Watson Knowledge Catalog 自帶的數(shù)據(jù)可視化工具,進行數(shù)據(jù)圖形化展示,這些功能都極大地方便了數(shù)據(jù)科學家對數(shù)據(jù)的處理和分析。如果數(shù)據(jù)科學家需要進行下一步的AI數(shù)據(jù)建模,還可以直接將這些數(shù)據(jù)不落地的送到我們的自動化 AI 建模工具 AutoAI 進行建模或者 BI 平臺 Cognos 進行報表展現(xiàn),真正實現(xiàn)數(shù)據(jù)目錄為業(yè)務人員服務的功能。

后記

智能數(shù)據(jù)目錄的建設,可以使業(yè)務人員或者數(shù)據(jù)科學家,隨時找到他們需要的數(shù)據(jù),并且可以通過自助的方式,獲取這些數(shù)據(jù)。這個功能,是實現(xiàn) Data Fabric 的第一步。建設好了智能的數(shù)據(jù)目錄,就為今后Data Fabric的建設打下了堅實基礎。Data Fabric 已經(jīng)成為 Gartner 在 2022 年最熱的IT趨勢的第二名。企業(yè)實現(xiàn) Data Fabric 的架構將是大勢所趨,讓我們先從建設智能的數(shù)據(jù)目錄開始吧。

原文標題:IBM Watson Knowledge Catalog:邁向智能化數(shù)據(jù)經(jīng)緯的第一步

文章出處:【微信公眾號:IBM中國】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)

    關注

    8

    文章

    7252

    瀏覽量

    91718
  • AI
    AI
    +關注

    關注

    88

    文章

    34936

    瀏覽量

    278306
  • 可視化
    +關注

    關注

    1

    文章

    1258

    瀏覽量

    21799

原文標題:IBM Watson Knowledge Catalog:邁向智能化數(shù)據(jù)經(jīng)緯的第一步

文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    博鼎彈簧發(fā)布數(shù)字目錄實現(xiàn)穩(wěn)定高效且易于操作的技術數(shù)據(jù)管理

    CADENAS****技術顛覆產(chǎn)品數(shù)據(jù)提供方式:一種全新的、行業(yè)領先的數(shù)字目錄 Mollificio Bordignon公司是一家以生產(chǎn)各種高質(zhì)量彈簧而聞名的公司,為了進一步提高產(chǎn)品數(shù)據(jù)質(zhì)量和優(yōu)化
    發(fā)表于 05-23 10:52

    北斗星通入選北京市專精特新出口產(chǎn)品目錄

    近日,在第二十七屆北京國際科技產(chǎn)業(yè)博覽會上,專精特新“京品出海”推介交流會暨《北京市專精特新企業(yè)出口產(chǎn)品參考目錄》(以下簡稱《出口目錄》)發(fā)布會成功舉辦。
    的頭像 發(fā)表于 05-13 18:15 ?453次閱讀

    追溯≠快速查詢!不止是查數(shù)據(jù),盤古信息MOM帶你看透真正的“全流程追溯”

    作為深耕制造業(yè)數(shù)字化轉(zhuǎn)型多年的資深服務商,盤古信息始終以技術創(chuàng)新驅(qū)動價值創(chuàng)造,通過自研IMS數(shù)字化智能制造系統(tǒng),助力企業(yè)建立覆蓋產(chǎn)品全生命周期的數(shù)字化管理體系,讓數(shù)據(jù)真正成為驅(qū)動質(zhì)量提升和效率變革的核心生產(chǎn)要素,讓企業(yè)產(chǎn)品品質(zhì)更
    的頭像 發(fā)表于 04-25 17:25 ?209次閱讀
    追溯≠快速查詢!不止是查<b class='flag-5'>數(shù)據(jù)</b>,盤古信息MOM帶你看透<b class='flag-5'>真正</b>的“全流程追溯”

    CubeIDE默認SDK目錄怎么更改?

    CubeIDE默認的SDK目錄與CubeMX目錄不共用,而后者可以修改默認目錄,有人知道CubeIDE默認SDK目錄怎么更改嗎
    發(fā)表于 03-11 06:56

    AI Cube進行yolov8n模型訓練,創(chuàng)建項目目標檢測時顯示數(shù)據(jù)目錄下存在除標注和圖片外的其他目錄如何處理?

    AI Cube進行yolov8n模型訓練 創(chuàng)建項目目標檢測時顯示數(shù)據(jù)目錄下存在除標注和圖片外的其他目錄怎么解決
    發(fā)表于 02-08 06:21

    DAC81408的建立時間為12uS,如何理解數(shù)據(jù)手冊中的12uS建立時間這個參數(shù)呢?

    數(shù)據(jù)手冊中,DAC81408的建立時間為12uS 而爬升速率0~5V為1V/uS,如果控制輸出從0V跳變至5V,以此時間計算,時間為5uS,小于12uS的建立時間典型值 如上圖所示為數(shù)
    發(fā)表于 12-09 08:33

    ADS54J60與JESD204B建立鏈路成功,但有效數(shù)據(jù)全為0,為什么?

    在配置ADS54J60采集數(shù)據(jù)并與JESD204B建立8224鏈路的過程中,嚴格按照ADC硬件復位、SPI寫入、JESD204B核心復位的順序進行,通過ILA(在線邏輯分析儀)抓取的波形數(shù)據(jù)來看
    發(fā)表于 11-19 06:00

    華為創(chuàng)新技術入選工信部節(jié)能技術推薦目錄

    由中國電子學會、中國電子技術標準化研究院主辦的“節(jié)能服務進企業(yè)”暨綠色數(shù)據(jù)中心對接推廣活動在安徽合肥成功召開。大會期間發(fā)布了《國家工業(yè)和信息化領域節(jié)能降碳技術裝備推薦目錄(2024年)》(以下簡稱
    的頭像 發(fā)表于 11-06 17:34 ?984次閱讀
    華為創(chuàng)新技術入選工信部節(jié)能技術推薦<b class='flag-5'>目錄</b>

    PGA281建立時間過長怎么解決?

    我的PGA281增益由1變128時,建立時間Settling time過長有800uS左右(增益切換后延時1ms也沒用),可數(shù)據(jù)手冊明明是40us
    發(fā)表于 08-22 06:14

    常見的shell命令之目錄相關命令

    1、pwd查看當前目錄命令:pwd英文全拼:print work directory功能:打印當前所在的路徑參數(shù):沒有其他參數(shù)示例:2、ls查看當前目錄的內(nèi)容命令:ls英文全拼:list功能:列出
    發(fā)表于 08-19 10:06

    常見的shell命令之目錄相關命令

    目錄相關命令1、pwd查看當前目錄命令:pwd英文全拼:print work directory功能:打印當前所在的路徑參數(shù):沒有其他參數(shù)示例:2、ls查看當前目錄的內(nèi)容命令:ls英文全拼:list
    發(fā)表于 08-16 09:22

    TINA如何建立噪聲源?

    TINA是否有現(xiàn)成的典型噪聲源(白噪聲等),如果沒有,如何建立噪聲源?
    發(fā)表于 08-01 08:21

    VSP1000低噪聲,快速建立,單位增益緩沖器數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《VSP1000低噪聲,快速建立,單位增益緩沖器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-26 10:24 ?0次下載
    VSP1000低噪聲,快速<b class='flag-5'>建立</b>,單位增益緩沖器<b class='flag-5'>數(shù)據(jù)</b>表

    InRouter與Juniper SRX如何建立IPSec隧道配置?

    拓撲圖中左側為LTE 4G 無線路由器,4G路由器使用SIM卡撥號上網(wǎng),獲得運營商分配的動態(tài)私網(wǎng)IP地址。右側為企業(yè)數(shù)據(jù)中心部署Juniper SRX防火墻,通過企業(yè)專線接入了互聯(lián)網(wǎng),并且使用靜態(tài)
    發(fā)表于 07-25 07:32

    使用STM32的外部數(shù)據(jù)總線與CY7C68013建立連接,如何獲得更高的傳輸速率?

    我試圖使用 STM32 的外部數(shù)據(jù)總線(如 FSMC)與 CY7C68013 建立連接,但不知道這樣能否成功連接并獲得更高的傳輸速率。 我還沒有找到這樣使用的例子。
    發(fā)表于 07-23 07:12
    主站蜘蛛池模板: 黄大仙区| 元阳县| 玉门市| 福泉市| 镇安县| 双峰县| 广河县| 乐至县| 原平市| 拜泉县| 交城县| 九台市| 南平市| 依安县| 阿坝| 鄢陵县| 察隅县| 建瓯市| 西盟| 杭锦后旗| 蓝田县| 乐山市| 扶沟县| 娱乐| 揭阳市| 隆子县| 金坛市| 延长县| 温泉县| 张家港市| 志丹县| 城固县| 轮台县| 临澧县| 永福县| 定远县| 塔河县| 广平县| 揭东县| 竹北市| 泾阳县|