熱門關(guān)鍵字:  聽(tīng)力密碼  聽(tīng)力密碼  新概念美語(yǔ)  單詞密碼  巧用聽(tīng)寫(xiě)練聽(tīng)力

MIC高性能計(jì)算編程指南

中國(guó)水利水電出版社
    【作 者】王恩東 張清 沈鉑 等 【I S B N 】978-7-5170-0338-0 【責(zé)任編輯】李炎 【適用讀者群】科技 【出版時(shí)間】2012-11-22 【開(kāi) 本】16開(kāi) 【裝幀信息】平裝(光膜) 【版 次】第1版第1次印刷 【頁(yè) 數(shù)】320 【千字?jǐn)?shù)】433 【印 張】20 【定 價(jià)】45 【叢 書(shū)】暫無(wú)分類 【備注信息】
圖書(shū)詳情

    本書(shū)是全球第一本全面介紹MIC軟硬件體系架構(gòu)、應(yīng)用及編程開(kāi)發(fā)優(yōu)化的書(shū)籍。書(shū)中介紹了使用MIC進(jìn)行通用計(jì)算所需要了解的硬件架構(gòu)、語(yǔ)法、程序優(yōu)化技巧等知識(shí),是進(jìn)行MIC高性能與通用計(jì)算程序開(kāi)發(fā)的入門教材和參考書(shū)。

    本書(shū)共分12章。第1章介紹高性能計(jì)算的發(fā)展歷程;第2章深入介紹MIC的軟硬件架構(gòu);第3章介紹MIC編程環(huán)境的搭建;第4章引入一個(gè)簡(jiǎn)單的MIC實(shí)例;第5章簡(jiǎn)要介紹與MIC編程相關(guān)的OpenMP和MPI相關(guān)知識(shí);第6章詳細(xì)講解了MIC編程的語(yǔ)法;第7章介紹MIC編程用到的工具軟件;第8章介紹MIC可以使用的數(shù)學(xué)庫(kù)及其用法;第9章詳細(xì)講解如何優(yōu)化MIC程序,從多個(gè)方面系統(tǒng)闡述了MIC優(yōu)化的方式和方法;第10章通過(guò)一個(gè)典型的矩陣乘法示例,展示MIC優(yōu)化方法的應(yīng)用;第11章介紹將MIC技術(shù)應(yīng)用于工程中的流程和方法;第12章引入兩個(gè)實(shí)際工程的例子,講解如何將MIC技術(shù)應(yīng)用于實(shí)際生產(chǎn)過(guò)程當(dāng)中。

    本書(shū)可作為MIC的入門學(xué)習(xí)和編程參考書(shū),主要面向從事高性能計(jì)算的程序員與工程師、MIC加速計(jì)算專業(yè)領(lǐng)域的科研人員,以及對(duì)MIC通用計(jì)算感興趣的程序員,也可作為開(kāi)設(shè)相關(guān)課程的高等院校與科研機(jī)構(gòu)的教材。

    前 言

    高性能計(jì)算是信息領(lǐng)域的前沿高新技術(shù),在保障國(guó)家安全、推動(dòng)國(guó)防科技進(jìn)步、促進(jìn)尖端武器發(fā)展方面具有直接推動(dòng)作用,是衡量一個(gè)國(guó)家綜合實(shí)力的重要標(biāo)志之一。隨著信息化社會(huì)的飛速發(fā)展,人類對(duì)信息處理能力的要求越來(lái)越高,不僅石油勘探、氣象預(yù)報(bào)、航天國(guó)防、科學(xué)研究等需求高性能計(jì)算,而且金融、政府、教育、企業(yè)、網(wǎng)絡(luò)游戲等更廣泛的領(lǐng)域?qū)Ω咝阅苡?jì)算的需求也在迅猛增長(zhǎng),百億億次計(jì)算(Exascale)已提上研究日程,人們正期待著未來(lái)采用百億億次計(jì)算機(jī)解決更大規(guī)模、更加復(fù)雜的問(wèn)題。

    21世紀(jì)多核、眾核時(shí)代已經(jīng)來(lái)臨,高性能計(jì)算產(chǎn)業(yè)正在經(jīng)歷一場(chǎng)深刻的變革,并行計(jì)算將是未來(lái)的發(fā)展趨勢(shì),也將再次成為研究熱點(diǎn)。目前主流的集群架構(gòu)系統(tǒng),采用CPU同構(gòu)模式,其單節(jié)點(diǎn)內(nèi)擁有十幾個(gè)甚至幾十個(gè)CPU計(jì)算核心已非罕事,大規(guī)模計(jì)算應(yīng)用中一次甚至可以利用數(shù)十萬(wàn)個(gè)以上CPU核心,然而采用CPU同構(gòu)架構(gòu)系統(tǒng)將面臨著性能功耗比、性能訪存比、并行效率等巨大挑戰(zhàn)。而采用CPU+GPU的異構(gòu)架構(gòu)進(jìn)行通用科學(xué)計(jì)算,利用GPU眾核技術(shù)進(jìn)行加速,在業(yè)界已掀起一陣熱潮,但其也面臨著細(xì)粒度并行算法、編程效率、大規(guī)模計(jì)算性能等重大挑戰(zhàn)。如何在提高大規(guī)模計(jì)算系統(tǒng)性能、提高軟件生產(chǎn)力的同時(shí)縮短編程周期,降低功耗將是我們思考和關(guān)注的焦點(diǎn)。

    Intel公司推出了基于集成眾核(Many Integrated Core,MIC)架構(gòu)的至強(qiáng)融核(Intel® Xeon PhiTM)系列產(chǎn)品,用于解決高度并行計(jì)算問(wèn)題。該產(chǎn)品雙精度性能達(dá)到每秒一萬(wàn)億次以上,它基于現(xiàn)有的x86架構(gòu),支持OpenMP、pThread、MPI等多種業(yè)內(nèi)熟悉的并行編程模型,采用傳統(tǒng)的C/C++/Intel® CilkTM Plus和Fortran等語(yǔ)言進(jìn)行軟件開(kāi)發(fā),其特點(diǎn)以編程簡(jiǎn)單(引語(yǔ)方式)著稱,具有豐富的工具鏈支持。對(duì)于采用傳統(tǒng)CPU平臺(tái)很難實(shí)現(xiàn)性能進(jìn)一步提升的部分應(yīng)用,使用MIC可以帶來(lái)性能的大幅提升,并且CPU與MIC可以共用一份代碼,在x86架構(gòu)下實(shí)現(xiàn)CPU+MIC異構(gòu)協(xié)同計(jì)算的完美結(jié)合,為廣大高性能計(jì)算用戶提供了全新的計(jì)算解決方案。

    浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室從2011年8月24日成立以來(lái),就一直參與MIC技術(shù)研究,并在MIC平臺(tái)開(kāi)展實(shí)際的高性能計(jì)算應(yīng)用項(xiàng)目工作,為Intel® Xeon PhiTM系列產(chǎn)品最終順利推出,貢獻(xiàn)了自己的一份力量。我們?cè)谏钊肓私釳IC軟硬件的同時(shí),也積累了大量的開(kāi)發(fā)經(jīng)驗(yàn)。我們很榮幸能夠參與到這場(chǎng)高性能計(jì)算的技術(shù)革命當(dāng)中,并作為先行者,將MIC技術(shù)介紹給各位讀者。希望通過(guò)本書(shū),能讓更多的讀者了解MIC技術(shù),并享受到Intel® Xeon PhiTM系列產(chǎn)品帶來(lái)的好處。

    本書(shū)適合的讀者

    本書(shū)的主要目標(biāo)是為開(kāi)發(fā)人員提供一些幫助,使他們能夠?qū)W會(huì)使用Intel® Xeon PhiTM系列產(chǎn)品,并利用其開(kāi)發(fā)、移植或優(yōu)化并行程序。本書(shū)的主要內(nèi)容是講述一些使用MIC技術(shù)時(shí)的編程語(yǔ)法、程序設(shè)計(jì)技術(shù)和優(yōu)化手段,并基于我們的應(yīng)用性能優(yōu)化經(jīng)驗(yàn),介紹一些在實(shí)際應(yīng)用中遇到的問(wèn)題和解決方案。

    我們假設(shè)讀者擁有一定并行程序開(kāi)發(fā)的基礎(chǔ)知識(shí),但是對(duì)MIC技術(shù)知之甚少。本書(shū)并非講解并行計(jì)算原理或算法的書(shū)籍,因此假設(shè)讀者擁有相關(guān)原理和算法的知識(shí),但是在面對(duì)具體并行算法時(shí),本書(shū)仍然會(huì)進(jìn)行描述。本書(shū)假設(shè)讀者熟悉OpenMP、MPI等并行編程常用的手段,但仍會(huì)對(duì)常用的語(yǔ)法進(jìn)行簡(jiǎn)要的介紹。本書(shū)假設(shè)讀者熟悉C/C++/Fortran中的一種或幾種編程語(yǔ)言,尤以熟悉C/C++為佳。但是,書(shū)中給出的許多思想和建議也同樣適合其他的高級(jí)語(yǔ)言,而且,如果以后Intel公司的Intel® Xeon PhiTM產(chǎn)品支持其他語(yǔ)言,絕大部分優(yōu)化手段和應(yīng)用經(jīng)驗(yàn)仍然可以適用。總的來(lái)說(shuō),此書(shū)大致適合三類人群:

    高校、科研院所學(xué)生、老師及科研人員,研究并行,研究多核、眾核技術(shù)者;

    IT從業(yè)人員,編寫(xiě)高性能計(jì)算軟件,利用眾核提升程序性能,在高性能計(jì)算領(lǐng)域追求性能的開(kāi)發(fā)人員尤為適用;

    行業(yè)高性能計(jì)算領(lǐng)域應(yīng)用人員,如石油勘探、生物基因、醫(yī)療圖像、金融、航空航天、氣象氣候、材料化學(xué)等人員,目的是利用MIC提升原CPU程序性能,從而提高生產(chǎn)力。

    我們希望通過(guò)我們的努力能夠使得本書(shū)讓更多的讀者受益,具有更加廣泛的讀者群。

    關(guān)于本書(shū)

    由于MIC架構(gòu)的特殊性,本書(shū)并不能被明確地歸到某一類中。這是一本介紹MIC編程語(yǔ)言的書(shū),這是一本介紹Intel® Xeon PhiTM產(chǎn)品的書(shū),這又是一本介紹并行編程優(yōu)化的書(shū)。通過(guò)閱讀本書(shū),我們希望讀者能夠盡量多地了解有關(guān)MIC的方方面面,更希望讀者能夠在未來(lái)的實(shí)踐中用上MIC技術(shù),用好MIC技術(shù)。

    本書(shū)由三篇組成。第一篇為“MIC基礎(chǔ)篇”,包括第1~8章,介紹MIC架構(gòu)的基礎(chǔ)知識(shí)。其中:

    第1章簡(jiǎn)要回顧了并行計(jì)算的發(fā)展歷程,并對(duì)市面上現(xiàn)有的并行計(jì)算的硬件技術(shù)進(jìn)行了對(duì)比,然后簡(jiǎn)要介紹了MIC技術(shù)的情況,并給出了MIC技術(shù)的優(yōu)勢(shì)。

    第2章介紹了支撐MIC技術(shù)的軟硬件架構(gòu)的相關(guān)知識(shí)。雖然沒(méi)有這些背景知識(shí)并不影響使用MIC編程,但深入了解MIC架構(gòu)能夠編寫(xiě)出更加適合MIC架構(gòu)的程序。

    第3章介紹了MIC運(yùn)行、編程環(huán)境的安裝和配置。由于MIC技術(shù)包含獨(dú)立的硬件以及相關(guān)的驅(qū)動(dòng)、編譯器、編程工具等一系列配套軟件,因此需要編程人員,尤其是系統(tǒng)配置人員對(duì)此有一定掌握。本章供需要配置系統(tǒng)的讀者閱讀。

    第4章通過(guò)一個(gè)計(jì)算圓周率PI的小例子,直觀地展示了MIC程序的特點(diǎn),并介紹了MIC程序背后的運(yùn)行流程。

    第5章介紹了MIC編程所需的背景知識(shí),包括OpenMP和MPI的基本語(yǔ)法。如果已有這方面的基礎(chǔ),可以跳過(guò)本章。

    第6章介紹了MIC的編程模式、語(yǔ)法、環(huán)境變量、編譯選項(xiàng)等。通過(guò)本章的學(xué)習(xí),可以掌握編寫(xiě)自己的MIC程序的方法。

    第7章介紹了MIC相關(guān)的調(diào)試和優(yōu)化工具以及它們的用法。學(xué)會(huì)使用工具,可以為調(diào)試和優(yōu)化帶來(lái)方便。

    第8章介紹了Intel公司的一些可以用在MIC上的數(shù)學(xué)庫(kù)的用法,包括VML、FFT、Blas等。

    第二篇為“性能優(yōu)化篇”,包括第9章和第10章的內(nèi)容。其中:

    第9章首先講述了MIC優(yōu)化的基本原則和策略,之后分不同方面詳細(xì)闡述了MIC優(yōu)化的方法與使用場(chǎng)合。本章講述的內(nèi)容已基本涵蓋MIC優(yōu)化的主要方法,而且,除個(gè)別方法以外,大部分方法也通用于CPU并行計(jì)算編程的實(shí)踐當(dāng)中。

    第10章通過(guò)對(duì)并行計(jì)算中典型示例——矩陣乘法的優(yōu)化,以理論結(jié)合實(shí)際的方式,一步步地詳細(xì)解釋了優(yōu)化步驟是如何應(yīng)用的。

    第三篇為“工程開(kāi)發(fā)篇”,包括第11章和第12章的內(nèi)容。這是全書(shū)的最后一部分,其中:

    第11章通過(guò)作者對(duì)自身團(tuán)隊(duì)工程開(kāi)發(fā)優(yōu)化經(jīng)驗(yàn)的總結(jié),提煉出一套并行程序開(kāi)發(fā)在工程應(yīng)用中的方法。對(duì)如何判斷一個(gè)串行或并行的CPU程序是否適用MIC進(jìn)行計(jì)算,并且如何將程序移植到MIC上進(jìn)行了討論。

    第12章通過(guò)兩個(gè)實(shí)際生產(chǎn)中的案例,講述了MIC技術(shù)是如何對(duì)實(shí)際項(xiàng)目產(chǎn)生影響的。

    本書(shū)前期由高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室主任、浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室主任、浪潮集團(tuán)高級(jí)副總裁王恩東牽頭,并明確寫(xiě)作方向,對(duì)技術(shù)發(fā)展趨勢(shì)把關(guān),浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室首席工程師張清具體負(fù)責(zé)制定寫(xiě)作計(jì)劃、確定整本書(shū)的提綱、結(jié)構(gòu)、每章節(jié)書(shū)寫(xiě)的內(nèi)容、風(fēng)格和讀者定位。中期由張清組織和推進(jìn)團(tuán)隊(duì)寫(xiě)作此書(shū),并定期進(jìn)行審閱,對(duì)執(zhí)筆作者完成的章節(jié)內(nèi)容的準(zhǔn)確性、技術(shù)表述的深淺度、可讀性進(jìn)行審核,并反饋修改意見(jiàn),具體由浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室工程師沈鉑、張廣勇、盧曉偉、吳慶、王婭娟五位作者共同執(zhí)筆,其中第1章由沈鉑撰寫(xiě),第2章由吳慶、沈鉑撰寫(xiě),第3章由王婭娟撰寫(xiě),第4章由沈鉑撰寫(xiě),第5章由沈鉑撰寫(xiě),第6章由沈鉑撰寫(xiě),王婭娟也參與了部分撰寫(xiě)工作,第7章由吳慶撰寫(xiě),第8章由盧曉偉撰寫(xiě),第9章由張廣勇撰寫(xiě),沈鉑、王婭娟也參與了部分撰寫(xiě)工作,第10章由張廣勇撰寫(xiě),第11章由沈鉑撰寫(xiě),第12章由盧曉偉、張廣勇撰寫(xiě)。后期由王恩東、張清、Intel公司的何萬(wàn)青(Warren)博士、Victor Lee(李匯強(qiáng))博士審閱,張清負(fù)責(zé)最后內(nèi)容審定、統(tǒng)稿。

    本書(shū)中全部完整的源代碼已經(jīng)過(guò)作者反復(fù)測(cè)試通過(guò),但由于MIC技術(shù)尚處于起步階段,不能保證源代碼在更新版本中仍然可用。因此,如果編譯器或MIC執(zhí)行環(huán)境有更新,請(qǐng)參閱相應(yīng)版本的Intel官方手冊(cè)。

    致謝

    本書(shū)的出版是團(tuán)體協(xié)作努力的結(jié)果。在此對(duì)為本書(shū)的編寫(xiě)和出版提供了巨大幫助的人們致以誠(chéng)摯的謝意。

    我們首先感謝浪潮集團(tuán)、Intel公司給我們這么好的一個(gè)平臺(tái),提供我們?cè)诶顺?Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室工作的機(jī)會(huì),讓我們有幸能研究MIC技術(shù);

    感謝浪潮集團(tuán)領(lǐng)導(dǎo)對(duì)此書(shū)的大力支持,尤其要感謝浪潮集團(tuán)高性能計(jì)算總監(jiān)劉軍對(duì)我們提供人力、物力、財(cái)力上的大力支持,以及對(duì)幾位作者的關(guān)懷和鼓勵(lì),此書(shū)才得以順利完成;

    感謝Intel公司的Michael Casscles,何萬(wàn)青博士,郭洪昌,David Scott博士,段小平,Victor Lee(李匯強(qiáng))博士對(duì)我們并行計(jì)算聯(lián)合實(shí)驗(yàn)室日常工作的技術(shù)和資源支持。尤其感謝何萬(wàn)青博士在開(kāi)始寫(xiě)書(shū)前,為此書(shū)的寫(xiě)作策劃提供經(jīng)驗(yàn)指導(dǎo),讓我們寫(xiě)書(shū)過(guò)程中少走很多彎路;特別感謝英特爾技術(shù)計(jì)算集團(tuán)總經(jīng)理Raj Hazra博士和技術(shù)計(jì)算市場(chǎng)總監(jiān)Joe Curley等領(lǐng)導(dǎo)對(duì)整個(gè)浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室工作、業(yè)務(wù)的支持;

    感謝我們的應(yīng)用客戶:中國(guó)石油集團(tuán)東方地球物理勘探有限責(zé)任公司,中國(guó)科學(xué)院生物物理研究所,西北工業(yè)大學(xué),中國(guó)氣象科學(xué)研究院,山東大學(xué)與我們?cè)贛IC項(xiàng)目上進(jìn)行合作。尤其感謝中國(guó)科學(xué)院生物物理研究所的孫飛研究員、張凱博士,西北工業(yè)大學(xué)的鐘誠(chéng)文教授、李勤儉等允許我們將雙方合作的項(xiàng)目作為書(shū)中的實(shí)際案例呈現(xiàn)給讀者。

    感謝浪潮集團(tuán),Intel公司對(duì)本書(shū)出版的大力支持,尤其感謝浪潮高性能服務(wù)器產(chǎn)品部蔣永昌經(jīng)理、張影對(duì)此書(shū)出版的幫助,為我們寫(xiě)書(shū)節(jié)省很多寶貴的時(shí)間;

    感謝一起合作過(guò)的謝海波博士,楊曉哲,我們不會(huì)忘記那段快樂(lè)的時(shí)光;

    感謝幾位作者的家人長(zhǎng)期以來(lái)對(duì)作者的關(guān)心和生活上的照顧;

    感謝中國(guó)水利水電出版社編輯們的辛勤勞動(dòng),尤其感謝策劃編輯周春元老師,責(zé)任編輯李炎老師認(rèn)真負(fù)責(zé)的工作和對(duì)我們無(wú)理要求的寬容,沒(méi)有你們的幫助,這本書(shū)就不會(huì)面市。

    最后,對(duì)前文未能提到的所有相關(guān)人員表示歉意,在此一并感謝。

    MIC技術(shù)剛剛興起,書(shū)中也難免有錯(cuò)誤和不能與時(shí)俱進(jìn)的地方,我們對(duì)此表示深深的歉意,并懇請(qǐng)各位讀者多提寶貴意見(jiàn)。

    張 清

    浪潮-Intel中國(guó)并行計(jì)算聯(lián)合實(shí)驗(yàn)室首席工程師

    序一
    序二
    前言
    第一篇 MIC基礎(chǔ)篇

    第1章 MIC高性能計(jì)算 3
    1.1 多核、眾核計(jì)算的發(fā)展 3
    1.2 MIC技術(shù)簡(jiǎn)介 6
    1.3 為什么要選擇MIC 7
    1.3.1 SMP 8
    1.3.2 集群(cluster) 8
    1.3.3 GPGPU 8
    第2章 MIC硬件及軟件架構(gòu) 11
    2.1 MIC硬件架構(gòu) 12
    2.1.1 術(shù)語(yǔ)解析 12
    2.1.2 MIC硬件架構(gòu)概覽 13
    2.1.3 MIC Core 15
    2.1.4 環(huán)形互聯(lián)總線Ring 27
    2.1.5 CLOCK 28
    2.1.6 頁(yè)表(Page Tables) 28
    2.1.7 系統(tǒng)接口 29
    2.1.8 性能監(jiān)控單元和事件管理器 35
    2.1.9 電源管理 36
    2.2 MIC軟件架構(gòu) 37
    2.2.1 概述 37
    2.2.2 Bootstrap 39
    2.2.3 Linux加載器 40
    2.2.4 微操作系統(tǒng)(OS) 40
    2.2.5 對(duì)稱通信接口(SCIF) 42
    2.2.6 主機(jī)驅(qū)動(dòng) 43
    2.2.7 sysfs節(jié)點(diǎn) 45
    2.2.8 MPI應(yīng)用的MIC軟件棧 46
    2.2.9 應(yīng)用編程接口(API) 53
    第3章 MIC安裝、環(huán)境配置 54
    3.1 MIC環(huán)境配置 54
    3.1.1 前期準(zhǔn)備 54
    3.1.2 安裝Host端的Linux操作系統(tǒng) 55
    3.1.3 安裝MIC驅(qū)動(dòng) 55
    3.1.4 安裝在MIC上編譯C/C++的編譯器 59
    3.2 SDK示例運(yùn)行 61
    第4章 第一個(gè)MIC實(shí)例——計(jì)算PI 63
    第5章 OpenMP和MPI編程基礎(chǔ) 66
    5.1 OpenMP基礎(chǔ) 66
    5.1.1 OpenMP簡(jiǎn)介 67
    5.1.2 OpenMP編程模型 67
    5.1.3 OpenMP語(yǔ)法簡(jiǎn)要介紹 67
    5.2 MPI基礎(chǔ) 72
    5.2.1 啟動(dòng)和終止MPI庫(kù) 73
    5.2.2 獲取信息 73
    5.2.3 發(fā)送和接收消息 74
    第6章 MIC編程 77
    6.1 MIC編程模型 77
    6.2 應(yīng)用模式 78
    6.2.1 CPU原生模式 79
    6.2.2 CPU為主MIC為輔模式 79
    6.2.3 CPU與MIC對(duì)等模式 80
    6.2.4 MIC為主CPU為輔模式 81
    6.2.5 MIC原生模式 81
    6.3 MIC基本語(yǔ)法 83
    6.3.1 offload 83
    6.3.2 變量和函數(shù)聲明 100
    6.3.3 頭文件 101
    6.3.4 環(huán)境變量 101
    6.3.5 編譯選項(xiàng) 102
    6.3.6 其他問(wèn)題 104
    6.4 MIC上的MPI 104
    6.4.1 MIC上的MPI限制 104
    6.4.2 MIC上MPI編程模型 105
    6.4.3 MIC上的MPI環(huán)境配置 107
    6.4.4 編譯及使用 109
    6.4.5 MIC上的MPI示例 109
    6.5 SCIF編程 112
    6.5.1 什么是SCIF 112
    6.5.2 SCIF的基本概念介紹 112
    6.5.3 SCIF基本通信過(guò)程 114
    6.5.4 SCIF用到的API函數(shù) 116
    第7章 MIC軟件調(diào)試與性能分析工具 120
    7.1 Intel軟件工具鏈對(duì)MIC的支持 120
    7.2 MIC軟件調(diào)試工具IDB 121
    7.2.1 IDB簡(jiǎn)介 121
    7.2.2 IDB的操作界面 121
    7.2.3 IDB對(duì)MIC架構(gòu)的支持與要求 122
    7.2.4 使用IDB調(diào)試MIC程序 123
    7.3 MIC性能分析工具VTune 146
    第8章 Intel MIC MKL庫(kù)使用方法 161
    8.1 Intel MKL核心函數(shù)庫(kù)介紹 161
    8.2 在MIC卡上使用Intel MKL 162
    8.2.1 編譯器輔助offload方式 163
    8.2.2 自動(dòng)offload方式 164
    8.3 FFT在MIC上的使用 168
    8.3.1 FFT簡(jiǎn)介 168
    8.3.2 FFT在MIC上的使用方法一 169
    8.3.3 FFT在MIC上的使用方法二 172
    8.4 BLAS在MIC上的使用 179
    8.4.1 BLAS簡(jiǎn)介 179
    8.4.2 在MIC上調(diào)用BLAS庫(kù)方法 179

    第二篇 性能優(yōu)化篇

    第9章 MIC性能優(yōu)化 185
    9.1 MIC性能優(yōu)化策略 185
    9.2 MIC優(yōu)化方法 187
    9.2.1 并行度優(yōu)化 187
    9.2.2 內(nèi)存管理優(yōu)化 190
    9.2.3 數(shù)據(jù)傳輸優(yōu)化 192
    9.2.4 存儲(chǔ)器訪問(wèn)優(yōu)化 206
    9.2.5 向量化優(yōu)化 210
    9.2.6 負(fù)載均衡優(yōu)化 219
    9.2.7 MIC線程擴(kuò)展性優(yōu)化 222
    第10章 MIC優(yōu)化示例:矩陣乘法 224
    10.1 矩陣乘法串行算法 224
    10.2 OpenMP多線程矩陣乘法 226
    10.3 MIC多線程矩陣乘法 226
    10.3.1 基本版本 226
    10.3.2 向量化優(yōu)化 227
    10.3.3 SIMD指令優(yōu)化 228
    10.3.4 矩陣分塊乘法 230

    第三篇 工程開(kāi)發(fā)篇

    第11章 基于MIC的HPC應(yīng)用開(kāi)發(fā)過(guò)程 251
    11.1 熱點(diǎn)測(cè)試 252
    11.1.1 準(zhǔn)備工作 252
    11.1.2 熱點(diǎn)測(cè)試及定位 253
    11.2 程序分析 256
    11.2.1 程序移植模式分析 256
    11.2.2 計(jì)算規(guī)模分析 256
    11.2.3 特點(diǎn)分析 257
    11.2.4 熱點(diǎn)并行性分析 260
    11.2.5 向量化分析 262
    11.2.6 MIC內(nèi)存分析 262
    11.2.7 程序分析總結(jié) 263
    11.3 MIC程序開(kāi)發(fā)過(guò)程 263
    11.3.1 基于CPU的OpenMP并行 264
    11.3.2 基于MIC的線程擴(kuò)展 265
    11.3.3 單節(jié)點(diǎn)CPU+MIC協(xié)同并行 265
    11.3.4 MIC集群并行 266
    第12章 基于MIC的HPC應(yīng)用實(shí)例 267
    12.1 基于單節(jié)點(diǎn)CPU+MIC協(xié)同計(jì)算電子
    斷層三維重構(gòu)并行算法 268
    12.1.1 電子斷層三維重構(gòu)技術(shù)及SIRT
    算法介紹 268
    12.1.2 SIRT串行程序分析 271
    12.1.3 基于OpenMP的SIRT并行程序
    開(kāi)發(fā) 273
    12.1.4 基于MIC平臺(tái)的SIRT并行程序
    開(kāi)發(fā) 276
    12.1.5 單節(jié)點(diǎn)多卡及CPU+MIC異構(gòu)協(xié)
    同計(jì)算架構(gòu)設(shè)計(jì) 279
    12.2 基于多節(jié)點(diǎn)CPU+MIC協(xié)同計(jì)算大渦
    模擬并行算法 284
    12.2.1 格子-Boltzmann大渦模擬算法
    介紹 284
    12.2.2 大渦模擬串行程序分析 288
    12.2.3 基于OpenMP的大渦模擬并行
    算法 290
    12.2.4 基于MIC的大渦模擬并行算法 293
    12.2.5 基于多節(jié)點(diǎn)CPU+MIC協(xié)同計(jì)算
    平臺(tái)的大渦模擬并行算法 296
    參考文獻(xiàn) 308

最新評(píng)論共有 0 位網(wǎng)友發(fā)表了評(píng)論
發(fā)表評(píng)論
評(píng)論內(nèi)容:不能超過(guò)250字,需審核,請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī)。
用戶名: 密碼:
匿名?
注冊(cè)
太湖县| 黄梅县| 新河县| 长泰县| 忻城县| 综艺| 汨罗市| 瑞金市| 额济纳旗| 阳原县| 商南县| 梨树县| 鄂尔多斯市| 泽库县| 高雄县| 德保县| 明水县| 锦屏县| 昌吉市| 合川市| 方山县| 积石山| 灵璧县| 东方市| 仁化县| 霍城县| 新竹县| 盖州市| 遂川县| 连州市| 桂林市| 绵竹市| 云阳县| 山阳县| 临夏市| 凉山| 伊宁市| 天柱县| 民权县| 陆丰市| 云梦县|