大數(shù)據(jù)的三個甜蜜謊言
人們說,大數(shù)據(jù)等于大潛力。人們在談論他們的大數(shù)據(jù)規(guī)模有多大,以及他們有多少數(shù)據(jù)點。他們談論著大數(shù)據(jù),好像它最重要。大數(shù)據(jù)突然無處不在,因為每個人似乎都在收集,分析和處理,并從使用大數(shù)據(jù)帶來的成功中賺取利潤。但在這里,有大多數(shù)人相信或選擇相信的大數(shù)據(jù)的三個謊言。畢竟,甜蜜的謊言有時比苦澀的真理更讓人愉快,是吧?在大數(shù)據(jù)的世界里,其炒作催生了一個全新的前提:有人認為如果企業(yè)使用大數(shù)據(jù),它會自動使企業(yè)更成功,而企業(yè)通常會吹噓他們的數(shù)據(jù)集的作用,就像一個老漁夫談起他所捕獲的魚的個頭(到少是真實大小的兩倍,聽起來更有影響力)。而這些企業(yè)就像可憐的漁夫一樣,想要人們感覺大數(shù)據(jù)更為重要,這是為什么有些東西被夸大的原因。即使這些并沒有被夸大,這并不意味著僅僅因為收集的大數(shù)據(jù)集,就會使企業(yè)業(yè)務表現(xiàn)良好。夸大信息的假定優(yōu)勢似乎是可以理解的,因為你知道的越多,就可能期望更好的結果。不幸的是,一旦數(shù)據(jù)確實變得更大,更多的問題也會出現(xiàn):信息更多,收集和系統(tǒng)化變得越困難。因此,當企業(yè)設法收集和系統(tǒng)化數(shù)據(jù),以便實際可以對數(shù)據(jù)運行分析時,不僅不會夸大數(shù)據(jù)集的大小,而且也不會在冷數(shù)據(jù)倉庫中消失。由于許多公司吹噓他們的數(shù)據(jù)集有多大,那么出現(xiàn)了一些主要的問題:有多少數(shù)據(jù)是必要的,是否適合提高你的決策質量?額外的信息(即數(shù)據(jù)點)是否添加了任何值,如果沒有,則為什么它在數(shù)據(jù)集中?在其本質上,人們如何知道所收集的數(shù)據(jù)是其需要的數(shù)據(jù),如何能夠獲得目前擁有的大部分信息? 大數(shù)據(jù)的使用只有在用于優(yōu)化和自動化解決方案并解決問題時才有意義。人們需要將注意力從僅收集大量所有可能的數(shù)據(jù)轉移到在自己的具體領域內對收集的數(shù)據(jù)進行分類。為了使數(shù)據(jù)有價值,它必須在模型中進行排序,處理和使用。長期短期收集數(shù)據(jù)是很好的行為,但要確保知道如何有效地理解它的意義是有效的。大數(shù)據(jù)的最大問題是了解大量的數(shù)據(jù)是很困難的,這在規(guī)模的上是無法理解的。雖然人們仍然相信數(shù)據(jù),大數(shù)據(jù)已經(jīng)變成一種營銷術語,這使企業(yè)業(yè)務聽起來更酷,如果企業(yè)正好使用它。讓人們面對:數(shù)據(jù)可能有問題。即使較小的數(shù)據(jù)集在技術上也可能是相當難以管理。更糟的是,沒有人知道你可能需要什么數(shù)據(jù),除非你嘗試它。如果你的目標是運行許多實驗(這是值得鼓勵的),還需要可靠的慣例實驗,不僅是基于工具,而是主要依靠一個有能力的數(shù)據(jù)科學團隊,控制一個有意義的框架來生成模型所使用的數(shù)據(jù)集,過度擬合等),并且開發(fā)適當?shù)哪繕俗兞浚沟盟占臄?shù)據(jù)能夠有新的使用案例。圖片來源:網(wǎng)絡
內容來源:高校大數(shù)據(jù)教育聯(lián)盟
轉載:中國教育信息化(ID:zgjyxxh)
1. 優(yōu)學云測評推出培訓機構個性化教學解決方案
2. 優(yōu)學云測評推出中小學校個性化教學解決方案
3. 優(yōu)學云測評推出招生平臺流量提升方案
4. 優(yōu)學云測評推出企業(yè)人才發(fā)展平臺解決方案——人才庫管理
5. 優(yōu)學云測評幫助個性化教育成為現(xiàn)實
優(yōu)學云測評精選的每一篇文章都會注明來源和作者(除非找不到),文章版權歸原作者所有,若有侵犯權益,請聯(lián)系我們刪除。本文所述內容僅代表作者觀點,不代表優(yōu)學云測評立場。對于本文以及其中全部或者部分內容、文字的真實性、完整性、準確性和合法性本公眾號不作任何保證或承諾。