Parallel Computing and Optimization for Sentiment Analysis Model

SNU 확장형고성능컴퓨팅 Final Project

Model Structure

ID	Kernel Optimization	Communication Optimization	Throughput(sentences/sec)	Commit Number
1	Naive Conv1D	Sequential Conv1Ds	686	43562e5
2	Conv1D to Input Spread and WMMA (Warp Matrix Multiply Accumulate, Use Tensor core)	Sequential Conv1Ds	4710	9635014
3	Add a & b SMEM tiling to WMMA Kernel(50% Occupancy)	Sequential Conv1Ds	9622	07acaef
4	ID3	Use 4 nodes (MPI Scatter/Gather)	29484	afd88a5
5	ID3	Logically Concurrent CONV1Ds	29437	67da912
6	Remove c SMEM from WMMA Kernel & Increase WMMA_BLOCKDIM to 1024 (100% Occupancy)	ID5	36542	583ccbe
7	ID6	Split WMMA with Pipelining	36800	3fcb6f3

shpc_final_project_report.md

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
include		include
src		src
tools		tools
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
nsys-final-timeline.png		nsys-final-timeline.png
nsys.nsys-rep		nsys.nsys-rep
nsys.qdstrm		nsys.qdstrm
run-ncu.sh		run-ncu.sh
run-nsys.sh		run-nsys.sh
run.sh		run.sh
sentiment_analysis_model_structure.png		sentiment_analysis_model_structure.png
shpc_final_project_report.md		shpc_final_project_report.md