│訂閱開卷 RSS 2.0 Feed
文章 - 1689, 迴響 - 2344, 引用 - 169, 本格總瀏覽人次 - 6051310
部落格首頁 › 編輯部落格總覽 › 開卷

文章分類

線上看報紙

最新文章

最新迴響

開卷嚴選:當我們變成一堆數字

2009-05-30 22:30迴響:0點閱:2395

 每一天,我們使用手機、電腦、信用卡、會員卡……都會送出無數關於我們的訊息,把每個人變成可以搜尋、可以解析的0與1。

 從IBM、Google、保險公司到歐巴馬競選團隊,莫不重金禮聘身懷絕技的「數字搜客」,從一大堆數字符碼中過濾出寶貴的趨勢和洞見。他們從熱門關鍵字中了解組織士氣或社會氛圍,觀察消費者在大賣場內的行走路徑和購物習慣,

 利用健康監控提早發現疾病徵兆,在茫茫人海中為男男女女找出最速配的另一半,用揪出賭場老千的技術追緝恐怖份子……

 不管你願意與否,「數字時代」已經來臨,正靜靜形塑著我們的生活、工作、購物、甚至戀愛方式,《當我們變成一堆數字》為你解讀這個大未來的運作和意義!

 

當我們變成一堆數字
The Numerati

作者:史蒂芬‧貝克(Stephen Baker)
譯者:齊若蘭
出版:遠流出版公司
定價:350元
出版日期:2009/04/30
類別:資訊

作者簡介:史蒂芬‧貝克(Stephen Baker)

 美國資深媒體觀察家與部落客。為美國《商業周刊》撰稿超過二十年,同時也在《華爾街日報》、《洛杉磯時報》與《波士頓環球報》發表文章。曾以墨西哥汽車產業興起專題報導榮獲海外記者協會獎。

 他與友人共同經營的部落格〈Blogspotting.net〉被《紐約時報》評為五十個最值得關注的部落格之一。

 

【書摘】

他們說的真的是「我」嗎?

 無論是職場或商場,甚至法庭上,數據分析一旦成為重要工具,我們就必須學會用數字來當武器。我們必須了解產出這些分析結果的方法,並且精通這些方法。每個人都必須思考一個問題:我希望把自己的哪些部分隱藏起來?

 

 在我們即將面臨的新世界裡,每個人最私密的資料都將曝光,至少某些人會看得到。我們或許有興趣(或至少願意)和別人分享其中一部分資料。例如,愛滋病患也許希望參與某項研究,因此願意透露和他們的症狀或精神狀態、甚至生活習慣相關的某些資訊,但是有一個條件:不能洩漏他們的名字。他們或許可以和別人分享個人資料,但他們的身分絕不能曝光。

 所以,我們勢必要重新評估我們對於隱私和秘密的觀念。每個人都有各式各樣的秘密。有的事情我們不會透露給任何人知道,有的事情我們會告訴一、兩個家人或朋友。很多時候,所謂的秘密都只是口頭上說說罷了,因為我們自己會忍不住多嘴講出去。但直到最近,我們的秘密都分散在各處。醫生為我們守住一部分秘密,銀行為我們守住另外一部分秘密,我們的中學老師、裁縫、鄰居、同事,也各自為我們守住一部分秘密。有的秘密只儲存在他們的記憶之中,偶爾才會在街談巷議中洩漏一些細節。有的秘密則藏在收據、處方、警局表格或學校警告的潦草字跡中。如果我們處理得當的話,大多數的秘密都不會混在一起,除非警探辦案時把諸多線索串聯起來,否則這些片片段段的資訊彼此不會產生任何關聯。但現在卻不一樣了。

 情況可能變得很可怕。無庸置疑,有的人會因此避開這個吞吐著龐大數據的世界。有的人即使鼓起勇氣在網路世界中探險,仍然躡手躡腳、小心翼翼的。他們會盡量用現金付款,避免因信用卡付款而留下蹤跡。需要付過路費時,他們甚至寧可大排長龍,等候投幣付費,而不願意快速通過自動讀取機(如此一來,就能追蹤到他們的動向,甚至能計算車子的平均時速)。

 

 但其實只要你多增加一點點知識,就可以把這些工具轉變為自己的優勢。你可能沒有留意,但是當你從本書第一章一路讀到最後一章時,已經逐漸從資料的奴隸演化為資料的主人。起初,企業運用這些工具來分析我們,希望發揮員工的最大效益,我們在他們的算計中,變得好像機器一樣。廣告商和政治操盤手搜集我們的資料,將我們分門別類,丟進不同的「桶」中。但是他們之所以這樣做,是為了針對我們的品味和價值,提供更多廣告和促銷活動,促使我們購買更多我們想要的東西。但一旦我們踏入英特爾的家庭健康實驗室,把感應器掛到身上,在我們的廚房地板鋪上與電腦連線的神奇地毯,情況就改變了,因為我們開始藉助數字搜客的科學,來保護自己不會跌倒,並在我們中風和心臟病發前提早發出警訊。我們在Chemistry.com網站上尋覓愛情之前,早已回到原點。我們付錢取得自己的演算式個人檔案,尋找與可能的約會對象之間的數學關聯。

 重點在於,這類統計工具將會靜悄悄地對我們的生活產生愈來愈大的影響。我們還不如好好學習如何取得掌控權,運用這些工具來保護自己的權益。

 那麼,我們應該從何開始呢?在目前的初步階段並不容易,可以做的事情包括認真閱讀商務網站上和信用卡申請表背面好像螞蟻字般的隱私權聲明。但是當我們愈來愈了解個人資料的價值和我們的脆弱之後,無疑我們將需要適當的服務來協助我們管理這些資料,如此一來,應該會吸引一些企業投入這個日益成長的市場。二○○五年創立的非營利機構AttentionTrust就首開風氣之先,為網民提供工具,讓他們收集自己的資料,並且可以依自己的選擇,把資料賣給廣告商。基本上,AttentionTrust鼓勵人們從自己的網頁瀏覽紀錄和網路書寫文字上獲利,而不是把資料白白奉送給塔科達、安布瑞亞之類的公司。目前,知道AttentionTrust的人還不多,僅只於經常上網的圈內人,而且到目前為止,我們可以出售個人資料的市場也剛萌芽。但是未來,當社會大眾逐漸曉得數字搜客如何利用和我們相關的資訊以後,情況就會改觀。

 

破解三大迷思

 某個星期天下午,我一邊打字,一邊戴著耳機,欣賞馬勒的交響曲——以免受到樓上家教課程的干擾,我十五歲大的兒子正在和代數辛苦奮鬥。我不禁好奇,在他一生中,他將被諸多統計奇才以上千種方式一步步分析,然後重新組合和最佳化,他需要學習哪些東西,來為這樣的人生作準備呢?他需要學高等微積分嗎?他應該鑽研作業研究,學習如何操作特徵向量和隱藏式馬可夫模型嗎?他和其他數以百萬計的人需要想辦法讓自己也變成數字搜客嗎?

 簡單一句,不需要。我們不妨先從幾世紀以來一直誤導這類討論的迷思說起:

一、整個世界可以分為文字人的世界和數字人的世界?

 大家之所以這麼說,只不過因為我們讓自己信以為真。事實上,數學家和電腦科學家嘴裡吐出來的也是文字,我見過許多數字搜客都能說兩、三種語言,其中有幾位還非常能言善道。另一方面,像你我一樣,自認是文字人、每次看到書上冒出夾著希臘字母和括號的公式、就翻到下一頁的人,其實腦子裡也充滿各種數字。我們經常在加減乘除,做各種盤算,然而對於代表這些思考過程的數學名詞卻感到非常陌生。比方說,假如小嬰兒十一點鐘醒來大哭,然後一點鐘和兩點半的時候又各哭了一次,這是否表示,他下一次哭的時間很可能是三點半呢?我們躺在床上,腦子裡其實悄悄在作迴歸分析的計算。

 數字搜客和我們其他人最大的不同在於他們所使用的工具,裡面包含成套的數學公式和幾千年來人類建構的各種演算法。他們企圖運用這些知識,把複雜的現實轉化為數字,因此可以測試和修正他們的理論。他們分析新建築能否屹立不搖或炸彈會不會爆炸,過去他們都自行處理這類傳統工作,因此無法駕馭這些工具(甚至看到數字就害怕)的我們對他們幾乎毫無貢獻。

 如今他們要面對的是截然不同的挑戰。數字搜客必需預測人類對汽車廣告或工資上漲有何反應。如果他們無法正確解讀人類行為,分析了錯誤的數據,他們建構的模型就可能走樣。要弄清楚如何將我們轉化為數字,不只需要正確的工具,還需要能充分理解真實世界。所以他們必須網羅來自不同領域、具備不同專業的人才,組成團隊。無論是人類學家、語言學家、甚至歷史學家,在這個領域都有很大的發揮空間。所以,即使過去所謂的「數字人」和「文字人」確實生活在兩個不同的世界,我們眼前所面臨的挑戰也將消弭分歧,跨越鴻溝。

二、數字搜客掌控一切,能對我們為所欲為?

 錯誤。即使是最厲害的數字搜客都只能在某些領域引領風騷,在其他領域,他們其實就好像你我一樣,只是被研究分析的對象。比方說,Google創辦人賴瑞.佩吉(Larry Page)是數字搜客世界的巨人。他手下的科學家正在打造的機器能分析數千億次搜尋和點擊,將我們包裹成不同的族群,然後把資料賣給廣告商。但是當葛特波姆的政治分析工具過濾消費者資料,將數百萬加州選民分門別類時,佩吉可能被丟入「心如止水派」或「右鍵點擊者」的桶中。無論數字搜客是帶有盲眼遺傳傾向的病患、或極有可能把糖果棒丟進推車裡的超市購物者,其實他們和你我一樣,只是龐大資料庫中的一份子罷了。

 這件事太棒了,因為這表示,儘管數字搜客佔據了有利位置,可以藉由我們的隱私資料獲利,但他們也和我們一樣深刻體會到自己的隱私可能如何遭踐踏,而且他們的體會比任何人都深刻。這也是為什麼拉斯維加斯的數據分析專家喬納斯後來會積極倡議隱私權保護。

三、懂得操控數字的人會賺走所有的錢?

 不可能。無庸置疑,他們會賺到錢,但不是所有的錢。回想一下汽車時代初露曙光的時候吧。當時在美國底特律和德國斯圖加特的小工廠中,工程師不停打造出將改變歷史軌跡的新機器,但還是有許多完全搞不懂什麼是活塞和交流電發電機的人等著靠汽車發大財。他們只需要了解趨勢,並且順勢而為,好好規劃自己的事業就好了。於是有的人開始在郊區蓋工廠和商場,或開設讓顧客外帶食物到車上吃的速食餐廳。有的人在高速公路必經之地收購土地,有的人則把無法通過巴拿馬運河的巨型油輪賣掉,娛樂事業也圍繞著F1賽車和NASCAR賽事蓬勃興起。對於能掌握趨勢的人而言,汽車經濟的大門完全是敞開的。

 

在頭痛問題中挖掘商機

 今天的情況也完全一樣。為了充分說明我的論點,請隨著我再探索一家公司——Inform科技公司(Inform Technologies)。公司創辦人尼爾.高德曼(Neal Goldman)原本從事金融業,現在正努力建立人生的第二筆財富。他並非精通演算法的奇才,但卻有豐富的想像力,能看到數字搜客的驚人潛力,同時他還展現了不可思議的能力,能挖掘出數字搜客中的高手。

 一九九○年代,高德曼才二十來歲,是紐約雷曼兄弟公司的潛力新秀。他每星期工作一百二十個小時,忙著處理高達數十億美元的跨國併購案。他說:「當時的生活真是緊繃得不得了。」他經常通宵熬夜,準備第二天一早要向主管作的口頭報告,所以他會坐在電腦前面敲敲打打,閱讀彭博社提供的數據、不同分析師的報告、以及公司年報中的統計數據,整合所有的數據很花時間。「我會花幾個小時把數據理出頭緒,然後放進Excel試算表上,這時候差不多已經是凌晨三點鐘了。」他回憶,「我開始思考這個問題。」他領悟到,整件事情實在太荒謬了,領高薪的專業人士通宵達旦地搜尋數字,然後再把數字輸入電腦中的試算表。「我花了十二小時來做這件事,其中思考時間只佔了一小時。」他說。

 高德曼在雷曼兄弟公司裡令人頭痛的工作模式中,看到了大好商機。所以他在一九九八年毅然辭職,開創自己的公司,他打算開發一種工具,能將他過去徹夜搜尋的各種片段資訊整合起來,而且只需要按一、兩下按鍵就能找到相關資料。比方說,如果有人想研究鋼鐵廠的投資案,除了鋼鐵公司的財務紀錄和股價起伏外,應該還能查到業界有哪些重要廠商、他們的背景為何,以及相關的分析報導;也應該有辦法追蹤到公司重要主管的背景,他們過去曾經在哪裡上班,曾就讀於哪些學校,和董事會成員有什麼關係。他計劃提供的服務能將龐大的世界經濟網,從原料供應到人際關係的所有片段資訊都組合起來,因此必須把龐雜的資訊全部融合到同一個符號世界裡。高曼不是數學家,但他知道,要讓所有的數據片段在同一個大池塘中流動,就必須讓它們說同一種語言。因此,他需要科技狂的幫忙。

 高德曼在網站上刊登廣告,有一天,一個叫喬.艾荷恩(Joe Einhorn)的十六歲高中生來敲門。高德曼說:「他非常害羞,害羞到不敢正視你的眼睛。」為了考考他,高德曼給男孩一項「不可能的任務」。喬幾天後再度現身,「他四十八小時沒睡,拚命寫程式。」於是,高德曼找到了一個數字搜客的生力軍。喬變成他的第一名員工。後來,喬的弟弟傑克也加入。傑克從十三歲起,就參加紐約大學和美國退伍軍人局合作的癌症研究計畫,在攝護腺癌發展過程中尋找基因表現的統計型態。

 他們的團隊持續成長,也不斷有新夥伴、投資人和技術專家加入。高德曼在腦海中勾畫的工具Capital IQ逐漸成形,而且還滿管用的。Capital IQ在複雜的向量矩陣中呈現金融世界的龐大資訊,並且依照資訊的關聯性呈現出其中的秩序。你想知道有哪些耶魯畢業生目前擔任企業董事?在螢幕上點一下,答案就會出現。那麼,有哪些前安隆主管目前繼續待在能源業?只要點兩下就好。二○○四年,高德曼為他的產品找到有興趣的客戶,他和合夥人以二億二千五百萬美元的價格,把公司賣給麥格羅希爾公司(McGraw-Hill)旗下的標準普爾事業部(Standard & Poor’s)。

 我見到高德曼之前,他已經開創了第二個新事業,這家叫Inform的新公司發展一種由數字搜客開發的精密武器,鎖定的對象是和我共事的夥伴——編輯。Inform在本質上和Capital IQ很像,他們大膽闖入多種語言的書寫新聞世界,試圖從網路上散播的各式各樣報導中,為讀者找到他們有興趣的新聞。

 在初步階段,Inform先將新聞世界理出脈絡,讓每一篇文章都和相關的新聞報導相連結。例如透過一篇關於委內瑞拉強人查維茲的特寫,讀者可以連結到一連串相關報導,包括一篇關於煉油業的文章、另外一則探討拉丁美洲革命的報導,第三則新聞是關於查維茲在莫斯科和德黑蘭的盟友,還有一篇文章探討查維茲和華府之間困難重重的關係。在Inform的架構中,每則新聞都是一條線索,所有的線索連結交織成分分秒秒都在變化、刻畫今日世界的巨大織錦。這是個野心勃勃的計畫,而且這只是起步而已。他們未來將追蹤讀者在網路上點閱和搜尋的足跡,將這些資料轉變成讀者的統計樣貌,那麼以後就能提供讀者客製化的新聞。

 要提供客製化的服務,艾荷恩兄弟率領的Inform團隊必須將全世界的新聞放在同一個數學平台上。根據傑克的解說,Inform的新聞世界就好像一個無數維的空間,新聞報導如同向量般穿越其中。每則報導都和報導中包含的人名和主題交會。在這個想像空間中,相關的報導會在同一個聚落中穿梭和交會。這種情形和我們在卡內基美崙大學的「下一個朋友」分析中見到的佈滿向量的銀河非常相似。但這一回,他們不是在你的社交網絡中搜尋會說法語的律師,他們可能是在搜尋你想閱讀的有關法國法令變動的文章。

 

開卷選書小組‧嚴選推薦

加入書籤:         
引用:http://blog.chinatimes.com/openbook/archive/2009/05/30/408334.html
2009-05-30 22:30作者:開卷分類:開卷嚴選迴響:0點閱:2395

回應這篇文章

*者為必填欄位

*回應標題:
*姓名 / 暱稱:
*E-Mail:
您的網站:
*回應內容:  
*驗證:
請輸入上圖六位數字驗證碼:

 
2009年5月
262728293012
3456789
10111213141516
17181920212223
24252627282930
31123456

編輯部落格最新文章

作家部落格最新文章

來賓部落格最新文章

旅遊部落格最新文章

財經部落格最新文章

電影部落格最新文章

體育部落格最新文章

音樂部落格最新文章

美食部落格最新文章

公益部落格最新文章

數位部落格最新文章