GPU高性能计算程序设计与深度学习应用高级实操班

发布时间:2017-08-11 09:48:10

 各有关单位:

随着信息技术飞速发展,需要处理的海量数据越来越巨大,高性能计算能力就显得尤为重要。近两年GPU(CUDA、OPENACC、OPENCL)计算在人工智能/深度学习、生物信息、金融、物理模拟等领域飞速发展,展现出相比传统CPU计算巨大的优势。GPU高性能计算程序设计最大限度的利用硬件资源,极大的提高了计算能力,降低时间成本,加速研发进度。特别是随着人工智能/深度学习技术的崛起,GPU计算已经成为深度学习计算的首选解决方案。为了培养GPU高性能计算以及深度学习技术人才,中国科学院计算技术研究所烟台分所特别邀请高性能计算及深度学习领域的专家,举办“GPU高性能计算程序设计与深度学习应用高级培训班“。

主办单位: 中国科学院计算技术研究所烟台分所 
承办单位: 北京中科云畅应用技术研究院
培训时间地点: 2017年 9月21日 — 2017年9月 24日 烟 台
(第一天报到,培训三天)
培训费用:每人 3900元(含报名费、培训费、资料费),食宿可统一安排,费用自理。
培训目标: 1、提高GPU高性能计算程序设计与开发水平;2、学习深度学习常用算法;3、学习并实践深度学习GPU计算解决方案;4、提供符合自身特点的工程计算解决方案。

培训对象:从事高性能计算、人工智能/深度学习、物联网、虚拟现实、生物信息、有限元、理论物理、分子模拟、计算化学、材料力学、系统仿真、流体力学、机械设计、动力设计、生物制药、航空动力、地质勘探、气候模拟、船舶设计等领域的企业单位、科研院所的计算技术开发人员,及高等院校相关专业教学人员及在校研究生、硕士、博士等相关人员。

培训方式: 1、培训讲座; 2、高性能计算环境下的上机实操 3、专题小组研讨与案例讲解分析结合;
报名办法:请各有关部门统一组织本地区行政、企事业单位报名参加会议,各单位也可直接报名参加。报名回执表请传真至会务处。


GPU高性能计算程序设计与解决方案培训班 课程大纲 


一、 GPU高性能计算——并行计算基础 1、并行计算的应用场景和实际意义(战略、经济和成本);2、并行计算机体系结构:处理器、内存和互连网,常用的并行计算机系统;3、性能分析模型:如何测量并行性能和扩展性;4、 CPU/GPU体系结构对比介绍:流水线、多核、缓存、访存、通信模型、分支预测等;5、 常用的高性能开发技术概述:5.1 OpenMP编程;5.2 Pthreads编程;5.3 MPI编程; 
上机实验:1、 求解π值 


二、GPU高性能计算——OpenACC编程基础与优化进阶 1、 OpenACC基础:概念,与CUDA区别,编译器,生态;2、 OpenACC开发环境搭建配置;3、 OpenACC四步开发流程:判断并行性,并行化表达,显式数据传递,优化 3.1判断并行性:Profile工具pgprof;3.2并行化表达:引导关键字Kernerls和Parallel Loop;3.3显式管理数据的拷贝:引导关键字Data;3.4优化:统一内存管理,线程并行层级,collapse,tile 
OpenACC上机实操:1. Hellow world; 2.矢量点乘; 


三、 GPU高性能计算——CUDA编程基础与优化进阶 1、 CUDA基础:API、数据并行、线程模型、存储模型、控制、同步、并发和通信、加速比;2、 CUDA开发环境搭建和工具配置;3、 CUDA优化进阶:线程组织调度,分支语句,访存优化,数据传输,原子操作;4、 GPU并行计算模式及案例分析: 分析调试:parallel nsight,visual profiler,cuda-gdb;5、 CUDA生态系统和相关专业领域软件介绍; 
CUDA上机实操:1. Helloworld,向量加,cuda库的使用(cuBLAS、cuFFT );2. 矩阵乘,直方图,卷积,规约,前缀求和 ; 


四、 大规模并行开发:多GPU开发 1、 GPU异步编程,多GPU编程(混合OpenMP和MPI)及调试调优工具;2、 OpenACC互操作性:OpenMP,MPI,CUDA; 
OpenACC上机实操:1、 Jacobi迭代,分形图 
五、 GPU高性能计算——OpenCL编程基础 1、 OpenCL:编程模型,存储模型,生态;CUDA vs OpenCL; 
OpenCL上机实操:1、点乘; 


六、 GPU高性能计算——深度学习 1、 深度学习基础介绍:神经网络,BP 方法,回归,统计学习,Hessian矩阵,基础数学等2、 常见的网络模型和平台框架:3、 深度学习GPU解决方案:3.1基于GPU的交互式深度学习训练平台:DIGITS;3.2深度学习框架的GPU加速:TensorFlow,Caffe等;3.3 NVIDIA深度学习SDK:cuDNN,TensorRT,NCCL;3.4深度学习显卡选择; 
深度学习上机实操:1、 使用DIGITS进行目标识别检测,信号处理;2、 Caffe,TensorFlow,Theano等通用深度学习框架的GPU加速库cuDNN的使用;3、 深度学习前端推理引擎TensorRT的使用;4、 单机多卡的深度学习解决方案NCCL实验; 


七、GPU计算最新技术前沿 1、CUDA 9新特性介绍;2、Pascal/Volta显卡架构介绍; 

联系人:林鸣
详询电话:17600460465


会议时间2017-09-21至2017-09-24
会议地点山东烟台
主办单位中国科学院计算技术研究所烟台分所
联系人林鸣
电话17600460465
Email1593736413@qq.com
会议规模31-50人

声明:

1.以上会议非科学网主办或承办会议,科学网会议频道会议来自于互联网方便用户了解行业信息,如需参会、汇款、获取邀请函或会议日程,请与主办单位联系
2.部分会议信息来自互联网,由于网络的不确定性,科学网对所发布的信息不承担真实性的鉴别工作,请谨慎选择汇款参会,若您发现信息有误,请联系010-62580809纠错
3.更多服务信息请点击这里
推荐会议