国产一区精品自拍,亚洲免费看色,成人超碰在线观看,1024手机看片金沙,美女黄色免费网站,男人操女人免费网站,xxxxwww欧美

天坦動態
大數據:看密西根大學如何化解數據科研中的倫理和不確定性問題
大數據:看密西根大學如何化解數據科研中的倫理和不確定性問題-智醫療網近年來,大數據已然成為強大的工具,密西根大學緊隨這一科技大趨勢,努力學習并開展大數據研究。
 
大學研究院副院長Jack Hu在2015年一次聲明中表示,大數據,即通過大量分析表明趨勢和關聯的數據,正在“對各學科研究進行大規模改革。”
 
密西根大學證實,該校在數據科學領域上的投資物有所值。學校在過去五年間對該項目(Data Science Initiative – DSI)資助了100萬美元,一些多學科和交叉學科領域的教研人員也參與到數據計算分析和管理研究中心的建設中。“我們的目標是在校園點燃創新研究,并取得數據科學本身的進步。”
 
Hu在2015年說道。大數據已成為醫學項目和疾病研究的核心,諸如巴拿馬文件泄密事件等國際貪腐丑聞的曝光和世界性的經濟技術發展也離不開大數據。例如,田徑運動相關的大量數據可以預測運動員受傷情況;授課分析可以開發更好的教學模式;還有大量患者信息可以用于診斷預測并分析健康情況。
 
密西根大學數據研究中心作為DSI項目的一部分,自成立兩年間得到了快速發展,已成為多學科、跨學院的數據研究。DSI項目下的另兩個子項目分別是先進研究算法(統計咨詢和技術服務)和計算分析研究。醫學和生物信息算法領域的教授Brian Athey稱,大數據的創新使用需求還在持續增長。
 
在大數據浪潮到來之前,密西根大學的研究人員就已經利用大量數據分析并預測引發疾病的病因、加強計算機科學的研究。先進研究算法負責人大學副校長Eric Michielssen說,要解決現實具體問題,首先需要‘海量’的數據,基于此他與Athey重申了大數據四個‘V’重要概念。
 
除了數據量(the volume of data)之外,研究人員還考慮到數據速度(velocity),即接收前所未有的大量數據的能力。接收的數據中還需要考慮到數據格式的多樣性(variety),數據格式不僅僅是常見的工作簿數據,最后一個‘v’是數據準確性(veracity),即數據的不確定性和有效性。
 
Michielssen稱,高效的日常數據收集和匯總– 尤其社交網絡和商業交易產生的大量數據通過無線技術、傳感器和復雜的網絡系統快速傳播 – 這要求研究人員重新考慮如何利用數據惠及社會和科學發展,這就是大數據的創新應用。
 
Michielssen說,“社會方方面面,各個領域的科研和教學都會受此影響,即大數據現象的影響。” 在Athey看來,數據科學的重要性在大學層面上– 尤其對擁有優秀科研資源的大學而言 – 可以從該校的科研史上可見一斑,看看大學是否在機器學習、數據分析、統計計算等學科發展方面已為今天的方法論做好研究準備。
 
“密西根大學提供一個理想環境”,根據摩爾定律,隨時間計算能力提高同時成本降低,Athey說,“大科學和大數據正重塑社會和高等教育。”MIDAS行政總監Kevin Smith博士稱,現在的數據科學家不必受過時的計算機規律的約束。相反,現代的數據管理需要MIDAS三層合作 –即一所大學作為學術中心、CSCAR咨詢等數據科學服務以及高性能計算平臺。“這是一個數據整合與有效應用的全局思考,你可以對任何待解決的科學問題或商業問題進行數據探索,通過分析、可視化,驗證你的做法是否正確。”
 
交通運輸與科技
 
Michielssen說,在數據科學研究上,大學側重實際結果,因此必然更注重應用而不是理論方法,尤其對政策、教育和基建方面的應用更是如此。“從方法論上,我們把這種大數據在其他領域中的應用當作發展大數據的絕佳機會。”Smith補充道。例如,MIDAS的數據運輸研究中心(Data-Driven Transportation Research)和數據密集性學習分析中心(Data-Intensive Learning Analytics)的研究人員利用大數據改善車輛使用模式、提高交通效率,并開發檢驗學習過程的新工具。
 
密西根大學交通研究院的副研究員Carol Flannagan說,他的團隊利用大數據分析司機行為,仿真交通規則、交通系統下的司機行為。“交通數據變化快,對現辦法的創新應用,甚至擴展現辦法或研發新方法,在交通運輸領域都大有用武之地。”
 
除了為交通分析提供大量數據外,Flannagan團隊在車禍調研方面也取得了成果,已開發了躲避車禍的技術應用。這些技術應用可以轉化為乘車人保護措施,而不是避免車禍。
 
團隊通過可視化工具和交通事故數據分析,提出了一系列車輛在車禍中抵御自身損害的措施,尤其在車輛設計、乘車人行為措施、道路設計等方面,為政策制定部門和基建設計單位提供新的可能性,通過優化設計、制定更好的制度避免不必要的傷亡。
 
從安全的全局出發,做出預測、制定交規,這需要研究者、政府其他機構共同努力。Flannagan說,一個阻礙就是數據共享性和數據快速訪問。他指出,“我們必須遵守數據分析中三思而后行的要求,只是,這個要求是極為苛刻的。”因為,大科學研究必定伴隨著大量挑戰,尤其對大數據需求還不斷變化的情況下更具挑戰。
 
社會科學與挑戰
 
2014年5月份,前總統奧巴馬公布了白宮官方報告,陳述了在數字時代個人信息安全、負責任的教育制度、以及公共來源的數據使用的重要性。“如果處理妥善,大數據將成為社會進步的重要推動力量,讓我們國家長治久安、經濟繁榮。”報告稱。此后,大數據在國家范圍內的使用一直飽受爭議,最近圍繞著2016年總統選舉中的大數據應用更是鬧得沸沸揚揚。起初,大數據被視為總統選舉結果的整體預測,盡管一些人認為現任總統特朗普起初否認大數據僅僅是為了掩蓋農村的投票信息。
 
Michael Traugott教授就可以還原未受社交和新聞媒體影響的公眾意愿。Traugott教授團隊聯合民意調查機構(Gallup)和喬治城大學(Georgetown University)收集數據驗證2016年總統競選期間政治話題。利用計算機軟件檢索成千上萬投票者對選舉的關鍵話題,研究人員可以得出公眾對媒體宣傳后產生的主流觀點。
 
公眾的主流觀點與9家主流報紙進行內容對比分析,與記者微博的內容對比分析,另一個指標是媒體報道對公眾情感的影響。Traugott說,“競選初期媒體對參選人的性格分析報道讓我驚訝不已,特朗普受到了不成比例的關注度。我們希望追蹤一些對候選人好感度不產生影響的媒體新聞以及公眾提及的話題。”Traugott利用數據判斷傳統的預設主題的報告方法是否在社交媒體環境下依然適用。
 
由于大數據可以影響政治,產生對抗性社會氛圍,華盛頓郵報呼吁:利用大數據代表各種可能性時,需要更深層的私人思考和技術政策。另外,由于數據收集階段就會存在內在偏倚– 無論大小 – 都會對結果產生影響,導致危險或者負面的結果。
 
研究人員每天面對公眾對隱私性和保密性的擔憂,這是意料外的阻礙。數據傳遞、醫療記錄以及社交信息是需要保障信息安全的三大領域。Michielssen說,“研究人員用軟件在聯網環境中進行研發,因此需要同時保障研究人員自身的信息安全。”Athey稱,人們對未知領域的態度既害怕又復雜,就像人們用大數據研究死亡的態度既恐懼又搖擺不定。
 
“大數據可以促進社會進步,或者直白的說,可以為不同社會團體所利用。”Athey接著說,“那些知道方法、有計算能力、可以獲取數據的人相比一般人擁有特殊優勢,可以做好事也可以做壞事。”他解釋道,‘數據文盲’就會處于不利地位。“如果你對數據科學缺乏知識,不會實踐,就有可能成為一個受害者。這就是我們生活的社會 – 谷歌和其他數據時代產物都不會消失。”Smith也注意到全球云數據倫理問題。“一個公司或許可以利用大數據獲取某種競爭優勢,我想這就是我們的社會演變和進化的過程。”
 
電子工程和計算機科學教授H.V. Jagadish開設了許多在線公開課程來檢驗數據科學的倫理問題。Jagadish教授的目的就是在線公開課程融入到數據科學培訓的課程之中,希望可以教數據科學家們‘恰當的數據科學。
 
Jagadish說,除了隱私性之外,數據科學還面臨其他的問題,比如算法的不精確、算法鑒別與偏倚。算法根據代入的數據會發生意外得出不需要的結果。然而,Jagadish也相信,盡管有諸多問題,人們會逐步控制、解決這些問題,最終達到數據科學規則方面的共識。“我們利用數據科學為我們自己做決策,或者利用多種來源的數據侵犯他人隱私,但我想說,雖不是所有人,但大多數人都愿意做有益的事情。我們所要做的就是充分探討并對正確的事情上取得共識。”

對未來數據的誤解
 
大數據可以預測社會變化或預測疾病發展。然而無奈的是,這門科學本身的發展卻是不可預測的。“因為這個學科發展太快,變化太快。”Michielssen說。分析工具的計算平臺的升級、分析技術的改進、方法論的變化依然是主要創新領域。這些創新并沒有在最近的互聯網大數據浪潮之中停滯不前。“一個誤區可能是所有老科學將會過時,數據科學將會取代所有過去十年間研發改良的成熟科技。”Michielssen認為這種觀點大錯特錯。“數據科學將強化現有技術,它是一個工具,只是科學家和工程師必備的重要工具,與其他工業分支一樣。但不會取代現有技術。”
友情鏈接: 北京膏滋堂科技發展有限公司 新型冠狀病毒全國中醫名家推薦預防方匯總