免费色播,亚洲国产欧美国产第一区二区三区,毛片看,日本精品在线观看视频,国产成人精品一区二区免费视频,日本黄色免费网站,一级毛片免费

什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

來(lái)源:網(wǎng)絡(luò)

點(diǎn)擊:1169

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞: 數(shù)據(jù)分析,數(shù)據(jù)挖掘,人工智能,機(jī)器學(xué)習(xí),深度學(xué)習(xí)

    0 數(shù)據(jù)時(shí)代/人工智能時(shí)代的降臨前夜

    從2016年開始,業(yè)界忽然針對(duì)機(jī)器學(xué)習(xí)和人工智能的追捧大行其道,其中更以Google推出的AlphaGo程序在2016年3月以4:1大勝韓國(guó)九段圍棋選手李世石;2016年歲末,在國(guó)內(nèi)棋類網(wǎng)站弈城網(wǎng)上出現(xiàn)了一個(gè)類似“圍棋上帝”的賬號(hào)(“圍棋上帝”是指每一步都絕對(duì)正確,每一步都絕對(duì)算到,洞悉全局的一切),在2016年12月29日至31日的3天時(shí)間里,神秘高手連勝柯潔九段、陳耀燁九段、樸廷桓九段、羋昱廷九段、唐韋星九段等高手。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    2017年初, AlphaGo化身神秘網(wǎng)絡(luò)棋手Master擊敗包括聶衛(wèi)平、柯潔、樸廷桓、井山裕太在內(nèi)的數(shù)十位中日韓圍棋高手,在30秒一手的快棋對(duì)決中無(wú)一落敗, 拿下全勝戰(zhàn)績(jī),在棋界和科技界引發(fā)劇震。

    AlphaGo的勝利充分讓世人認(rèn)識(shí)到了AI(Artifical Intelligence)的威力和未來(lái),于是人工智能忽然之間離我們近在咫尺;對(duì)于我們大部分人來(lái)說(shuō),到底什么是人工智能?它是忽然之間冒出來(lái)的新概念嗎?接下來(lái)筆者將為各位讀者梳理一下其發(fā)展的路徑以及歷程以及主要的關(guān)鍵詞。

    1 數(shù)據(jù)分析(Data Analysis)

    伴隨著信息化時(shí)代的降臨,人類第一次有了數(shù)據(jù)化的概念和積累;基于數(shù)據(jù)庫(kù)系統(tǒng)和應(yīng)用程序,可以直觀查看統(tǒng)計(jì)分析系統(tǒng)中的數(shù)據(jù),從而可以很快得到我們想要的結(jié)果;這個(gè)就是最基本的數(shù)據(jù)分析功能,也是我們?cè)谛畔⒒瘯r(shí)代了,除了重構(gòu)業(yè)務(wù)流程、提升行業(yè)效率和降低成本之外,另一個(gè)非常重要的數(shù)據(jù)分析功能,數(shù)據(jù)直觀化。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    舉例如下,在財(cái)務(wù)系統(tǒng)的信息化中,基于企業(yè)的財(cái)務(wù)系統(tǒng),我們可以直觀獲取企業(yè)現(xiàn)金流量表、資產(chǎn)負(fù)債表和利潤(rùn)表,這些都來(lái)自與我們的數(shù)據(jù)分析技術(shù)。目前常用的軟件是Excel, R, Python等工具。

    2 數(shù)據(jù)挖掘(Knowledge-Discovery in Databases)

    簡(jiǎn)稱KDD,從其英文縮寫中可以發(fā)現(xiàn),其是基于數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)發(fā)現(xiàn)過(guò)程,立足與數(shù)據(jù)分析技術(shù)之上,提供更為高端和高級(jí)的規(guī)律趨勢(shì)發(fā)現(xiàn)以及預(yù)測(cè)功能;同時(shí)數(shù)據(jù)量將變得更為龐大,依賴于模式識(shí)別等計(jì)算機(jī)前沿的技術(shù);其還有另外一個(gè)名稱為商業(yè)智能(BI, Business Intelligence),依托于超大型數(shù)據(jù)庫(kù)以及數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市等數(shù)據(jù)庫(kù)技術(shù)來(lái)完成。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    主要的應(yīng)用領(lǐng)域在電子商務(wù)領(lǐng)域,主要的原因是電商時(shí)代其有迫切的數(shù)據(jù)挖掘的需求和應(yīng)用場(chǎng)景,比如經(jīng)典的啤酒與尿布的關(guān)聯(lián)性就是電商應(yīng)用中的一個(gè)例子。

    主要挖掘方法有: 分類 (Classification), 估計(jì)(Estimation), 預(yù)測(cè)(Prediction), 相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinity grouping or association rules), 聚類(Clustering), 復(fù)雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)等技術(shù)。

    此時(shí)的數(shù)據(jù)挖掘不足之處主要集中在數(shù)據(jù)庫(kù)系統(tǒng)對(duì)于數(shù)據(jù)的檢索分析能力支持有限,數(shù)據(jù)處理能力的不足大大限制了商業(yè)應(yīng)用的進(jìn)行,大部分場(chǎng)景下都是基于數(shù)據(jù)抽樣的分析;同時(shí)挖掘應(yīng)用需要進(jìn)行定制化的開發(fā),開發(fā)和維護(hù)成為即為昂貴,應(yīng)用領(lǐng)域非常的狹小。

    這個(gè)時(shí)代主要的數(shù)據(jù)挖掘的解決方案主要集中在BI之上,主要來(lái)自于Oracle, IBM, Microsoft等數(shù)據(jù)庫(kù)廠商的解決方案。

    3 機(jī)器學(xué)習(xí)

    隨著2006年以Hadoop為代表的大數(shù)據(jù)技術(shù)的蓬勃興起,解決了數(shù)據(jù)庫(kù)時(shí)代的數(shù)據(jù)存儲(chǔ)和處理能力的不足限制;云計(jì)算技術(shù)的大規(guī)模應(yīng)用,比如Amazon和阿里云為代表的云計(jì)算廠商,將處理能力和計(jì)算能力的成本大大降低,從而讓大規(guī)模的集群計(jì)算系統(tǒng)變得非常廉價(jià);從而將針對(duì)數(shù)據(jù)的分析拓展至全量的數(shù)據(jù)分析,而非數(shù)據(jù)抽樣。另外一個(gè)方面是將從前在數(shù)據(jù)挖掘時(shí)代無(wú)法應(yīng)用的算法和思路變成了可能。這個(gè)時(shí)代ML(Machine Learning)逐漸取代數(shù)據(jù)挖掘,成為火熱的關(guān)鍵詞。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    那機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系是什么呢? 機(jī)器學(xué)習(xí)是建立在數(shù)據(jù)挖掘技術(shù)之上發(fā)展而來(lái),結(jié)合大數(shù)據(jù)技術(shù)(Hadoop, MapReduce, Spark/Storm等),逐步開發(fā)和應(yīng)用了若干新的分析方法逐步演變而來(lái)形成的;這兩個(gè)領(lǐng)域彼此之間交叉滲透,彼此都會(huì)利用對(duì)方發(fā)展起來(lái)的技術(shù)方法來(lái)實(shí)現(xiàn)業(yè)務(wù)目標(biāo),數(shù)據(jù)挖掘的概念更廣一下,機(jī)器學(xué)習(xí)只是數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)新興分支與細(xì)分領(lǐng)域,只不過(guò)基于大數(shù)據(jù)技術(shù)讓其逐漸成為了當(dāng)下顯學(xué)和主流。

    以下是摘在百度知道的定義:機(jī)器學(xué)習(xí)(Machine Learning, ML)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    上述定義的核心是嘗試基于計(jì)算機(jī)系統(tǒng)來(lái)模擬人類的學(xué)習(xí)行為,從而獲取新的知識(shí)與技能;換句話說(shuō),機(jī)器學(xué)習(xí)可以發(fā)展我們?nèi)祟愇丛l(fā)現(xiàn)的知識(shí)和規(guī)律,學(xué)習(xí)到人類從未掌握的技能;這是一個(gè)非常驚人的進(jìn)步,超越人類的認(rèn)知極限,從而引領(lǐng)人類進(jìn)入了一個(gè)嶄新的機(jī)器時(shí)代。

    機(jī)器學(xué)習(xí)已經(jīng)有了十分廣泛的應(yīng)用,例如:數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語(yǔ)言處理、生物特征識(shí)別、搜索引擎、醫(yī)學(xué)診斷、檢測(cè)信用卡欺詐、證券市場(chǎng)分析、DNA序列測(cè)序、語(yǔ)音和手寫識(shí)別、戰(zhàn)略游戲和機(jī)器人運(yùn)用。在我們當(dāng)下的生活中,語(yǔ)音輸入識(shí)別、手寫輸入識(shí)別等技術(shù),識(shí)別率相比之前若干年的技術(shù)識(shí)別率提升非常巨大,達(dá)到了將近97%以上,大家可以在各自的手機(jī)上體驗(yàn)這些功能,這些技術(shù)來(lái)自于機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。Google Translate技術(shù)據(jù)說(shuō)已經(jīng)達(dá)到了類比人工翻譯的準(zhǔn)確程度,兼具“信達(dá)雅”的特性,能做到這一點(diǎn)就來(lái)自于Google對(duì)其進(jìn)行了大量語(yǔ)言學(xué)習(xí)的訓(xùn)練而成的。

    機(jī)器學(xué)習(xí)主要以監(jiān)督學(xué)習(xí)(supervised learning)、無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等形式。下面我們簡(jiǎn)要介紹以下這幾種學(xué)習(xí)形式的基本內(nèi)容:

    監(jiān)督學(xué)習(xí)是 對(duì)具有概念標(biāo)記(分類)的訓(xùn)練樣本進(jìn)行學(xué)習(xí),以盡可能對(duì)訓(xùn)練樣本集外的數(shù)據(jù)進(jìn)行標(biāo)記(分類)預(yù)測(cè)。這里,所有的標(biāo)記(分類)是已知的。監(jiān)督學(xué)習(xí)是訓(xùn)練神經(jīng)網(wǎng)絡(luò)和決策樹的最常見技術(shù)。這兩種技術(shù)(神經(jīng)網(wǎng)絡(luò)和決策樹)高度依賴于事先確定的分類系統(tǒng)給出的信息。

    在非監(jiān)督式學(xué)習(xí)中,數(shù)據(jù)并不被特別標(biāo)識(shí),學(xué)習(xí)模型是為了推斷出數(shù)據(jù)的一些內(nèi)在結(jié)構(gòu)。常見的應(yīng)用場(chǎng)景包括關(guān)聯(lián)規(guī)則的學(xué)習(xí)以及聚類等。常見算法包括Apriori算法以及k-Means算法。

    在此學(xué)習(xí)方式下,介于監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)之間。輸入數(shù)據(jù)部分被標(biāo)識(shí),部分沒有被標(biāo)識(shí),這種學(xué)習(xí)模型可以用來(lái)進(jìn)行預(yù)測(cè),但是模型首先需要學(xué)習(xí)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)以便合理的組織數(shù)據(jù) 來(lái)進(jìn)行預(yù)測(cè)。應(yīng)用場(chǎng)景包括分類和回歸,算法包括一些對(duì)常用監(jiān)督式學(xué)習(xí)算法的延伸,這些算法首先試圖對(duì)未標(biāo)識(shí)數(shù)據(jù)進(jìn)行建模,在此基礎(chǔ)上再對(duì)標(biāo)識(shí)的數(shù)據(jù)進(jìn)行預(yù) 測(cè)。如圖論推理算法(Graph Inference)或者拉普拉斯支持向量機(jī)(Laplacian SVM.)等。

    在這種學(xué)習(xí)模式下,輸入數(shù)據(jù)作為對(duì)模型的反饋,不像監(jiān)督模型那樣,輸入數(shù)據(jù)僅僅是作為一個(gè)檢查模型對(duì)錯(cuò)的方式,在強(qiáng)化學(xué)習(xí)下,輸入數(shù)據(jù)直接反饋 到模型,模型必須對(duì)此立刻作出調(diào)整。常見的應(yīng)用場(chǎng)景包括動(dòng)態(tài)系統(tǒng)以及機(jī)器人控制等。常見算法包括Q-Learning以及時(shí)間差學(xué)習(xí)(Temporal difference learning)。

    以上幾種學(xué)習(xí)形式,目前使用最多的是監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)模式,在自然語(yǔ)言處理(NLP),圖形圖像識(shí)別等領(lǐng)域應(yīng)用甚廣。強(qiáng)化學(xué)習(xí)更多的應(yīng)用在機(jī)器人控制及其他需要進(jìn)行系統(tǒng)控制的領(lǐng)域。

    此類的技術(shù)解決方案在Python, R都提供了相應(yīng)的機(jī)器學(xué)習(xí)的算法實(shí)現(xiàn),比如scikit-learn和R中的內(nèi)置算法實(shí)現(xiàn)。

    4 深度學(xué)習(xí)(Deep Learning)

    深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像,聲音和文本。深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示?;逎y懂的概念,略微有些難以理解,但是在其高冷的背后,卻有深遠(yuǎn)的應(yīng)用場(chǎng)景和未來(lái)。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    那深度學(xué)習(xí)和機(jī)器學(xué)習(xí)是什么關(guān)系呢? 深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的一種方式和一條路徑。其核心是模擬和學(xué)習(xí)人類大腦的神經(jīng)元工作方式,比如其按特定的物理距離連接;而深度學(xué)習(xí)使用獨(dú)立的層、連接,還有數(shù)據(jù)傳播方向,比如最近大火的卷積神經(jīng)網(wǎng)絡(luò)是第一個(gè)真正多層結(jié)構(gòu)學(xué)習(xí)算法,它利用空間相對(duì)關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能,讓機(jī)器認(rèn)知過(guò)程逐層進(jìn)行,逐步抽象,從而大幅度提升識(shí)別的準(zhǔn)確性和效率。

    到了當(dāng)下,經(jīng)過(guò)深度學(xué)習(xí)技術(shù)訓(xùn)練的機(jī)器在識(shí)別圖像時(shí)比人類更好,比如識(shí)別貓、識(shí)別血液中的癌細(xì)胞特征、識(shí)別MRI掃描圖片中的腫瘤。谷歌AlphaGo學(xué)習(xí)圍棋等等領(lǐng)域,已經(jīng)超越了人類目前的認(rèn)知和能力極限。

    主要的實(shí)現(xiàn)框架包括有:Google的Tensorflow, 源自加州伯克利分校的Caffe, 誕生于蒙特利爾理工學(xué)院的Python實(shí)現(xiàn)Theano, 來(lái)自facebook的Torch, Java版的深度學(xué)習(xí)框架DeepLearning4j等等不一而足。

    5 人工智能(Artifical Intelligence, AI)

    人工智能目前在業(yè)界是炙手可熱,所有的互聯(lián)網(wǎng)公司以及各路大迦們紛紛表態(tài)AI將是下一個(gè)時(shí)代的革命性技術(shù),可與互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)時(shí)代的變更相媲美;AlphaGo在圍棋領(lǐng)域戰(zhàn)勝人類最頂尖的棋手讓大眾第一次直觀認(rèn)知到了AI的威力和強(qiáng)大,于是大家都不禁在思考到底什么是人工智能, 它將帶給人類一個(gè)什么樣的變化和未來(lái)?

    1956年,在達(dá)特茅斯會(huì)議(Dartmouth Conferences)上,計(jì)算機(jī)科學(xué)家首次提出了“AI”術(shù)語(yǔ)之時(shí),就設(shè)想是否有一天機(jī)器可以像人一樣擁有意識(shí)(consciousness)、自我(Self)和心智(Mind),隨著計(jì)算機(jī)工業(yè)和科學(xué)的飛速發(fā)展,曾經(jīng)的幻想和遙不可及的設(shè)想已經(jīng)可以看到變成現(xiàn)實(shí)的曙光。

    那人工智能到底是什么呢? 筆者個(gè)人的理解是人工智能將學(xué)會(huì)人腦一樣的思考、分析、推理和學(xué)習(xí),具備人類相應(yīng)的智商和獨(dú)立思考能力;進(jìn)而可能具備自我迭代和進(jìn)化能力,幫助人類共同進(jìn)行進(jìn)化,極大提升目前人類社會(huì)的智能化程度。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    正如我們?cè)?jīng)看到過(guò)的諸多科幻典型中所描述的各類場(chǎng)景,筆者個(gè)人也比較認(rèn)同其中的某些負(fù)面的可能性,不如當(dāng)機(jī)器具備類似人類的智能之后,機(jī)器智能和人類將如何相處? 如果發(fā)生沖突,人類何以控制機(jī)器智能,并引導(dǎo)人工智能按照人類的意志來(lái)發(fā)展? 人類是否有能力控制機(jī)器智能的運(yùn)行機(jī)制?等等之類的問(wèn)題只能有待未來(lái)的科學(xué)家們來(lái)解決。

    深度學(xué)習(xí)、機(jī)器學(xué)習(xí)都是人工智能發(fā)展的重要領(lǐng)域,這些技術(shù)手段讓人工智能從虛幻逐步變?yōu)楝F(xiàn)實(shí),在帶給人類諸多便利和大幅度的社會(huì)效率提升中,即將革命性地改變我們?nèi)祟惿鐣?huì)的進(jìn)程發(fā)展。

    6 總結(jié)

    深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的發(fā)展帶了許多實(shí)際的商業(yè)應(yīng)用,讓虛幻的AI逐步落地,進(jìn)而影響人類社會(huì)發(fā)展; 深度學(xué)習(xí)、機(jī)器學(xué)習(xí)以及未來(lái)的AI技術(shù),將讓無(wú)人駕駛汽車、更好的預(yù)防性治療技術(shù)、更發(fā)達(dá)智能的疾病治療診斷系統(tǒng)、更好的人類生活?yuàn)蕵?lè)輔助推薦系統(tǒng)等,逐步融入人類社會(huì)的方方面面。

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘以及數(shù)據(jù)分析?

    AI既是現(xiàn)在,也是未來(lái),不再是一種科幻影像和概念,業(yè)界變成了人類社會(huì)當(dāng)下的一種存在,不管人類是否喜歡或者理解,他們都將革命性地改變創(chuàng)造AI的我們?nèi)祟愖陨?;至于未?lái),沒有人會(huì)知道會(huì)如何,會(huì)不會(huì)真得如Matrix中的人類最終被機(jī)器所篡養(yǎng),不得而知;但有一點(diǎn)是確定的,人類孜孜以求的研究和發(fā)展,AI時(shí)代終將到來(lái)。

    (審核編輯: 林靜)

    聲明:除特別說(shuō)明之外,新聞內(nèi)容及圖片均來(lái)自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請(qǐng)聯(lián)系我們刪除。