Top Banner
1 슈슈슈슈슈슈슈슈 슈슈슈슈슈슈슈슈 슈슈슈슈 슈슈슈 슈슈 슈슈슈슈 슈슈슈 슈슈 2005.5.13 2005.5.13
37

슈퍼컴퓨팅센터의 클러스터 컴퓨팅 주제

Jan 09, 2016

Download

Documents

Amos

슈퍼컴퓨팅센터의 클러스터 컴퓨팅 주제. 2005.5.13. 슈퍼컴퓨팅센터의 의무 슈퍼컴퓨팅 환경 변화 적응을 위한 선도 연구 / 개발  최신 기술 전파 최신 기술에 기반한 서비스 제공 컴퓨팅 자원 / 서비스의 품질과 경제성 향상 고성능 클러스터 컴퓨팅 / 응용 기술의 확산  과학 / 기술 계산량 / 복잡도 증가 , 편의성 , 효율성 요구 증대  대용량 계산 자원 / 기술 수요발생 E-Science & E-Manufacturing, IT839 등 국가생존을 위한 정부 추진 - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

1

슈퍼컴퓨팅센터의 슈퍼컴퓨팅센터의 클러스터 컴퓨팅 주제클러스터 컴퓨팅 주제

2005.5.132005.5.13

Page 2: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

2/38

슈퍼컴퓨팅센터의 의무슈퍼컴퓨팅센터의 의무 슈퍼컴퓨팅 환경 변화 적응을 위한 선도 연구 / 개발최신 기술 전파 최신 기술에 기반한 서비스 제공 컴퓨팅 자원 / 서비스의 품질과 경제성 향상

고성능 클러스터 컴퓨팅고성능 클러스터 컴퓨팅 // 응용 기술의 확산 응용 기술의 확산 과학 과학 // 기술 계산량기술 계산량 //복잡도 증가복잡도 증가 , , 편의성편의성 , , 효율성 요구 증대 효율성 요구 증대 대용량 계산 자원 대용량 계산 자원 // 기술 기술 수요발생수요발생

E-Science & E-Manufacturing, IT839E-Science & E-Manufacturing, IT839 등 국가생존을 위한 정부 추진 등 국가생존을 위한 정부 추진

프로젝트들은 고성능프로젝트들은 고성능 , , 고효율고효율 , , 경제성높은 클러스터 슈퍼컴퓨팅과 경제성높은 클러스터 슈퍼컴퓨팅과

그 응용 서비스를 필요그 응용 서비스를 필요

국가 과학기술과 산업분야에서 연구국가 과학기술과 산업분야에서 연구 // 개발 경쟁력 향상을 위해 클러스터 개발 경쟁력 향상을 위해 클러스터 // 응용 기술등의 현업 적용 확대 서비스 모델 발굴응용 기술등의 현업 적용 확대 서비스 모델 발굴 // 제시 필요 제시 필요

Page 3: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

3/38

목표목표 국내 확보 기술로 대규모 컴퓨팅 자원의 확보방안 마련국내 확보 기술로 대규모 컴퓨팅 자원의 확보방안 마련

대규모 클러스터의 구축대규모 클러스터의 구축 , , 운영 및 최적화 기술 연구운영 및 최적화 기술 연구 // 개발개발 기술의 수준 기술의 수준 : : 대표적인 세계기술과 동급 또는 우수대표적인 세계기술과 동급 또는 우수 22 년 내에 년 내에 20 TeraFlops20 TeraFlops 급의 고성능 클러스터 기술 확보급의 고성능 클러스터 기술 확보

대규모 클러스터 컴퓨팅 핵심 기술 원형 개발대규모 클러스터 컴퓨팅 핵심 기술 원형 개발 차기 클러스터 운영 및 모니터링 기술 확보차기 클러스터 운영 및 모니터링 기술 확보 차기 클러스터 시스템 서비스를 위한 병렬 프로그램 환경 정의차기 클러스터 시스템 서비스를 위한 병렬 프로그램 환경 정의

응용응용 // 가시화가시화 // 그리드그리드 (e-Science) (e-Science) 연계 활용의 시범 연계 활용의 시범 환경 구축환경 구축

클러스터 응용클러스터 응용 // 서비스 모델 발굴 서비스 모델 발굴 / / 적용 적용 클러스터 컴퓨팅의 현업 응용 클러스터 컴퓨팅의 현업 응용 // 서비스 모델 개발서비스 모델 개발

Page 4: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

4/38

내용내용 국내 확보 기술로 대규모 컴퓨팅 자원의 확보방안 마련국내 확보 기술로 대규모 컴퓨팅 자원의 확보방안 마련

대규모 클러스터 시스템을 위한 병렬 파일 시스템 기술력 확보대규모 클러스터 시스템을 위한 병렬 파일 시스템 기술력 확보 대규모 클러스터 관리를 위한 프레임웍대규모 클러스터 관리를 위한 프레임웍 , , 도구 개발도구 개발

응용응용 // 가시화가시화 // 그리드그리드 (e-Science) (e-Science) 연계 활용의 시범 환경 구축연계 활용의 시범 환경 구축 가시화 클러스터 구축 기술 확보가시화 클러스터 구축 기술 확보

클러스터 응용클러스터 응용 // 서비스 모델 발굴 서비스 모델 발굴 / / 적용 적용 RDDM(Research and Development Data Management) RDDM(Research and Development Data Management) 시스템 시스템 Prototype Prototype

연구연구 슈퍼컴퓨팅센터내의 컴퓨팅 자원의 효율적 분배를 위한 각 시스템 및 슈퍼컴퓨팅센터내의 컴퓨팅 자원의 효율적 분배를 위한 각 시스템 및

응용프로그램의 성능 비교응용프로그램의 성능 비교 RPRP 클러스터 기술 개발클러스터 기술 개발 네트워크 에뮬레이션 클러스터 구축네트워크 에뮬레이션 클러스터 구축 클러스터 기술 센터 운영클러스터 기술 센터 운영

Page 5: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

5/38

전략전략 Hamel Hamel 클러스터 운영을 통해 파악한 문제점 해결을 통해 클러스터 운영을 통해 파악한 문제점 해결을 통해

차기 클러스터 구축에 필요한 기술 확보차기 클러스터 구축에 필요한 기술 확보 클러스터 컴퓨팅 효율화를 위한 기술 및 데이터 확보클러스터 컴퓨팅 효율화를 위한 기술 및 데이터 확보 클러스터 기술센터 활동을 통한 기술 확산과 공동 연구 기회 클러스터 기술센터 활동을 통한 기술 확산과 공동 연구 기회

증대증대 다양한 응용분야 확대다양한 응용분야 확대

Page 6: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

6/38

클러스터 시스템 환경을 위한 자체적인 클러스터 시스템 환경을 위한 자체적인 병렬 파일 시스템 기술력 확보 및 개발병렬 파일 시스템 기술력 확보 및 개발 (1/3)(1/3)

20052005 년 계획년 계획 분석분석 (Analysis)(Analysis)

주요 병렬 파일 시스템 기능 비교 분석주요 병렬 파일 시스템 기능 비교 분석 파일 시스템 성능 측정 도구 기능 비교 분석파일 시스템 성능 측정 도구 기능 비교 분석 구성 요소별 파일 시스템 성능 상관 관계 분석구성 요소별 파일 시스템 성능 상관 관계 분석

설계설계 (Design)(Design) 프로토타입 설계프로토타입 설계 (1(1 단계단계 ))

Page 7: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

7/38

클러스터 시스템 환경을 위한 자체적인 클러스터 시스템 환경을 위한 자체적인 병렬 파일 시스템 기술력 확보 및 개발병렬 파일 시스템 기술력 확보 및 개발 (2/3)(2/3)

병렬 파일 시스템별 기능 비교 분석병렬 파일 시스템별 기능 비교 분석 기존 병렬 파일 시스템들의 주요 기능기존 병렬 파일 시스템들의 주요 기능 , , 장단점및 특이 사항 장단점및 특이 사항

파악파악 PVFS, PVFS2, Lustre, GFSPVFS, PVFS2, Lustre, GFS 등등

파일 시스템 성능 측정 도구 기능 비교 분석파일 시스템 성능 측정 도구 기능 비교 분석 클러스터 시스템 도입시 파일 시스템에 대한 테스트 기준 모호클러스터 시스템 도입시 파일 시스템에 대한 테스트 기준 모호 측정 도구의 특징을 비교 분석한후 적합한 측정 도구측정 도구의 특징을 비교 분석한후 적합한 측정 도구 (( 집합집합 ) )

도출도출

구성 요소별 파일시스템 성능 상관 관계 분석구성 요소별 파일시스템 성능 상관 관계 분석 병렬 파일 시스템의 성능에 영향을 미치는 요소를 파악병렬 파일 시스템의 성능에 영향을 미치는 요소를 파악 파일 시스템에 대하여 여러 구성 요소를 변경하면서 성능 분석파일 시스템에 대하여 여러 구성 요소를 변경하면서 성능 분석

Page 8: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

8/38

클러스터 시스템 환경을 위한 자체적인 클러스터 시스템 환경을 위한 자체적인 병렬 파일 시스템 기술력 확보 및 개발병렬 파일 시스템 기술력 확보 및 개발 (3/3)(3/3)

프로토타입 설계프로토타입 설계 (1(1 단계단계 )) 11 단계단계

Prototype Prototype 구성 구성 - - 기본 골격 구성기본 골격 구성 핵심적인 핵심적인 User InterfaceUser Interface 및 및 Command Command 구현구현

2~32~3 단계 단계 기본 구조 보강기본 구조 보강 User InterfaceUser Interface 및 및 Command Command 확장 확장 로우레벨 파일 시스템 개발 및 로우레벨 파일 시스템 개발 및 File System CommFile System Comm

and and 개발개발

Page 9: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

9/38

클러스터 관리 환경 구축클러스터 관리 환경 구축목표목표

클러스터 시스템 운영클러스터 시스템 운영 // 관리를 위한 도구들과 이를 관리를 위한 도구들과 이를 체계화 할 프레임워크의 개발체계화 할 프레임워크의 개발

수십 테라급 통합 클러스터 관리 시스템을 위한 기반 수십 테라급 통합 클러스터 관리 시스템을 위한 기반 인프라 개발인프라 개발

내용내용 클러스터 관리 시스템을 위한 프레임워크클러스터 관리 시스템을 위한 프레임워크 모니터링 도구모니터링 도구 커널 디버깅 도구커널 디버깅 도구

Page 10: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

10/38

클러스터 관리 시스템을 클러스터 관리 시스템을 위한 프레임워크 개발위한 프레임워크 개발 (1/3)(1/3)

클러스터 시스템 운영클러스터 시스템 운영 // 관리에 필요한 도구들의 개발과 관리에 필요한 도구들의 개발과 이용을 쉽게 할 프레임워크의 개발이용을 쉽게 할 프레임워크의 개발

통합 클러스터 관리 시스템 구축을 위한 기반 인프라 통합 클러스터 관리 시스템 구축을 위한 기반 인프라 다양한 클러스터 도구들의 연관성을 높임다양한 클러스터 도구들의 연관성을 높임 분산 관리 기술의 축적분산 관리 기술의 축적

Page 11: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

11/38

클러스터 관리 시스템을 클러스터 관리 시스템을 위한 프레임워크 개발위한 프레임워크 개발 (2/3)(2/3)

목표 사양목표 사양 Service Oriented Service Oriented

ArchitectureArchitecture Messaging MiddlewareMessaging Middleware Support DMTF standard Support DMTF standard

(CIM based)(CIM based) Real-Time Service Real-Time Service

OperationOperation Provide Powerful UI (X-Provide Powerful UI (X-

Internet based)Internet based)

개발 내용개발 내용 Messaging ProtocolMessaging Protocol Service Modeling Service Modeling

Registry ServiceRegistry Service Directory ServiceDirectory Service Repository ServiceRepository Service

Management Structure Management Structure ComponentsComponents

X-Client/ServerX-Client/Server

Page 12: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

12/38

클러스터 관리 시스템을 클러스터 관리 시스템을 위한 프레임워크 개발위한 프레임워크 개발 (3/3)(3/3)

Adapter

Node Manager

Registry

Service Manager

IndicationService

Service

Messaging Bus

Adapter

Node Manager

Registry

Service Manager

IndicationService

Service

Adapter

Node Manager

Registry

Service Manager

IndicationService

Service

Adapter

Node Manager

Registry

Service Manager

IndicationService

Service

Cluster Manager

Directory

Service Manager

IndicationService

X-Server

Adapter

Reposito

ry

X-Client

CMF ArchitectureX-Client

Service Oriented Architecture

Messaging Middleware

Real-Time Service Operation

DMTF based Model

Page 13: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

13/38

모니터링 도구 개발모니터링 도구 개발 (1/3)(1/3) 클러스터 시스템에 대한 모니터링 및 장애 복구를 위한 능동적인 클러스터 시스템에 대한 모니터링 및 장애 복구를 위한 능동적인

모니터링 도구 개발모니터링 도구 개발 ( ( 각 개별 각 개별 node node 중점중점 ))

20052005 년도 계획년도 계획 분석분석

주요 모니터링 도구 동작 구현 분석주요 모니터링 도구 동작 구현 분석 주요 모니터링 도구의 각 노드별 동작 분석주요 모니터링 도구의 각 노드별 동작 분석 (( 자원 소모자원 소모 , , 성능 등성능 등 )) 장애에 대한 분석 및 분류장애에 대한 분석 및 분류 장애 복구를 위한 방법장애 복구를 위한 방법 , , 동작동작 , , 기능 분석 및 분석기능 분석 및 분석

설계설계 노드별 기능 및 동작 설계노드별 기능 및 동작 설계 노드단에서 동작을 수행하기 위한 기본 스키마 동작 설계노드단에서 동작을 수행하기 위한 기본 스키마 동작 설계 장애 복구에 대한 분석장애 복구에 대한 분석 장애 증상 및 장애 복구에 대한 지식 데이터 베이스 스키마 분류 및 장애 증상 및 장애 복구에 대한 지식 데이터 베이스 스키마 분류 및

작성작성 구현구현

장애 복구를 위한 스키마 작성장애 복구를 위한 스키마 작성 노드단에서 정보 취합 및 장애 감지노드단에서 정보 취합 및 장애 감지 // 복구를 담당하는 에이전트 구현복구를 담당하는 에이전트 구현

Page 14: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

14/38

모니터링 도구 개발모니터링 도구 개발 (2/3)(2/3) 인터페이스인터페이스

웹 인터페이스웹 인터페이스 (Viewer, (Viewer, 설정설정 )) 모니터링 모니터링

시스템에 대한 주기적인 모니터링시스템에 대한 주기적인 모니터링 개별 노드에서 데이터 전송개별 노드에서 데이터 전송 관리 노드에서 데이터 취합 관리 노드에서 데이터 취합

장애 확인 및 동작 장애 확인 및 동작 장애 발생시 관리노드에 전송 기능장애 발생시 관리노드에 전송 기능 장애에 대한 대처 수행 부분장애에 대한 대처 수행 부분

DatabaseDatabase 장애에 대한 데이터 베이스장애에 대한 데이터 베이스 장애 복구에 대한 데이터 베이스장애 복구에 대한 데이터 베이스

Page 15: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

15/38

모니터링 도구 개발모니터링 도구 개발 (3/3)(3/3)

Page 16: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

16/38

커널 디버깅 도구 개발커널 디버깅 도구 개발 (1/3)(1/3) 필요성필요성

현재 클러스터 계산노드에서 현재 클러스터 계산노드에서 system hang system hang 발생시발생시 , , 해당 노드 해당 노드 시스템을 시스템을 reboot reboot 시키는 것으로 장애 처리시키는 것으로 장애 처리

hang/crashhang/crash 의 원인을 규명할 수 있는 절차의 원인을 규명할 수 있는 절차 // 방법방법 // 도구 부재도구 부재 kernel-level checkpointing kernel-level checkpointing 툴 개발을 위한 사전 연구툴 개발을 위한 사전 연구

목표목표 커널 디버깅 및 커널 로그 툴 관련 연구 및 개발을 통해 시스템의 커널 디버깅 및 커널 로그 툴 관련 연구 및 개발을 통해 시스템의

장애 발생시 원인을 정확히 규명하여 차후 동일 장애를 예방장애 발생시 원인을 정확히 규명하여 차후 동일 장애를 예방 사용자의 사용자의 application application 문제일 경우 올바른 가이드 라인 제시문제일 경우 올바른 가이드 라인 제시 kernel kernel 및 라이브러리 문제일 경우 해결안 강구및 라이브러리 문제일 경우 해결안 강구

Page 17: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

17/38

커널 디버깅 도구 개발커널 디버깅 도구 개발 (2/3)(2/3) 접근 방법접근 방법

HPC HPC 클러스터의 커널 디버깅 프로세스의 절차의 클러스터의 커널 디버깅 프로세스의 절차의 표준안 확립표준안 확립

Automated Cluster System Debugging Solution Automated Cluster System Debugging Solution 구현구현 HPC HPC 클러스터 시스템의 클러스터 시스템의 hang/crash hang/crash 등의 에러 패턴에 등의 에러 패턴에

대한 이해대한 이해

Magic SysRq

LKCD

Ksymoops

Lcrash

hang or crash dump analysis test, studyhang or crash dump analysis test, study oops & provide solutionoops & provide solution

KDB(KGDB,GDB)Kernel HooksKprobes

Klogdevlog

Page 18: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

18/38

커널 디버깅 도구 개발커널 디버깅 도구 개발 (3/3)(3/3) 목표 결과목표 결과

oops and crash replica tool oops and crash replica tool knowledge of crash/hang pattern of HPC cluster knowledge of crash/hang pattern of HPC cluster automated cluster debugging solutionautomated cluster debugging solution technical documents for debugging tools & methodtechnical documents for debugging tools & method

착안착안 enhancement of Magic-Sys-Rqenhancement of Magic-Sys-Rq Automatic Hang detectionAutomatic Hang detection

never implemented in linux cluster environment before. never implemented in linux cluster environment before. can refer AIX 5.2 implementation whitepapercan refer AIX 5.2 implementation whitepaper

Automatic crash detectionAutomatic crash detection make it as a kernel module make it as a kernel module

Linux Kernel

LKCD(crash detect)

MagicSysRqHang detect

Page 19: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

19/38

가시화 클러스터 시스템가시화 클러스터 시스템 (1/5)(1/5)

클러스터를 기반으로 다수의 컴퓨터의 출력화면을 클러스터를 기반으로 다수의 컴퓨터의 출력화면을 하나로 연결해서 일반 하나로 연결해서 일반 PCPC 로는 구현이 불가능한 수준의 로는 구현이 불가능한 수준의 초고해상도의 단일화면을 구현한 시스템 개발초고해상도의 단일화면을 구현한 시스템 개발

Page 20: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

20/38

가시화 클러스터 시스템가시화 클러스터 시스템 (2/5)(2/5)

목적목적 하드웨어 가속 볼륨 렌더링 하드웨어 가속 볼륨 렌더링

GPU GPU 클러스터를 이용한 대용량 볼륨 데이터의 실시간 가시화 클러스터를 이용한 대용량 볼륨 데이터의 실시간 가시화 e-Science e-Science 환경을 위한 가시화 플랫폼 환경을 위한 가시화 플랫폼 국제 협업 가시화 환경 구축 국제 협업 가시화 환경 구축

OptIPuter OptIPuter 공식 노드로 참가 공식 노드로 참가 / iGrid 2005 / iGrid 2005 시연 시연

Page 21: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

21/38

가시화 클러스터 시스템가시화 클러스터 시스템 (3/5)(3/5)문제점문제점 && 목표목표 클러스터의 모든 노드를 동원해도 클러스터의 모든 노드를 동원해도 512x512x512 512x512x512 크기의 데이터 가시화 불가능 크기의 데이터 가시화 불가능

목표 데이터의 크기목표 데이터의 크기 : 1024x1024x1024: 1024x1024x1024 구현 과정에서 반드시 필요한 작업의 현저한 처리속도 차이 구현 과정에서 반드시 필요한 작업의 현저한 처리속도 차이

고성능 비디오 카드를 채용하여 가시화 성능의 고성능 비디오 카드를 채용하여 가시화 성능의 34.634.6배 향상 가능배 향상 가능

시스템 구성시스템 구성 가시화 클러스터 가시화 클러스터

PCI-expressPCI-express 를 지원하는 비디오 카드 및 대용량 메모리 장착 를 지원하는 비디오 카드 및 대용량 메모리 장착 대용량 데이터를 저장하기 위한 디스크 장치 대용량 데이터를 저장하기 위한 디스크 장치 빠른 데이터 전송을 위한 고속 네트워크 설치빠른 데이터 전송을 위한 고속 네트워크 설치 (Infiniband, 10Gbps) (Infiniband, 10Gbps)

프로젝터 큐브 프로젝터 큐브 해상도 확장 해상도 확장 ( ⇒ , 33% ( ⇒ , 33% 확대확대 ))

Page 22: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

22/38

가시화 클러스터 시스템가시화 클러스터 시스템 (4/5)(4/5)

InfinibandSwitch

Login

Dell 4

Dell 1

Dell 2

Dell 3

Node 01

Node 02

Node 03

Node 04

Node 05

Node 06

Node 07

Node 08

Tile 1 Tile 2

Tile 5 Tile 6 Tile 7

Tile 3 Tile 4

Tile 8

3~5 TB

Physical organization

ParallelComputer

Internalnetwork

Externalnetwork

Infiniband

Video

Frame lock

Page 23: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

23/38

가시화 클러스터 시스템가시화 클러스터 시스템 (5/5)(5/5)

시스템 활용시스템 활용 e-Science e-Science 환경의 가시화 시스템환경의 가시화 시스템

다수의 다수의 rendering image stream, rendering image stream, 화상회의를 위한 화상회의를 위한 A/V streamA/V stream 을 동시에 받아서 출력할 수 을 동시에 받아서 출력할 수

있는 고성능 시스템 개발있는 고성능 시스템 개발 GPU GPU 클러스터 기반 분산 렌더링 기술 개발 클러스터 기반 분산 렌더링 기술 개발 비압축 데이터의 원격 가시화 기술 개발비압축 데이터의 원격 가시화 기술 개발

OptIPuter OptIPuter 프로젝트 테스트베드프로젝트 테스트베드 10Gbps GLORIAD10Gbps GLORIAD 를 이용하는 한국의 공식 를 이용하는 한국의 공식 OptIPuter OptIPuter 노드 역할노드 역할 iGrid 2005 iGrid 2005 시연 시연

PIRE PIRE 프로젝트 테스트베드프로젝트 테스트베드 SDSCSDSC 에서 주도에서 주도 , , 협업 가시화 환경협업 가시화 환경

고성능 가시화 시스템 구축기술 확보고성능 가시화 시스템 구축기술 확보 고성능 가시화 시스템을 필요로 하는 대학교 연구실에 기술 보급고성능 가시화 시스템을 필요로 하는 대학교 연구실에 기술 보급

Page 24: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

24/38

RDDM RDDM 시스템 시스템 Prototype Prototype 연구연구 (1/5)(1/5)- - 정의 및 구성요소 정의 및 구성요소 --

RDDMRDDM 의 정의의 정의 Research and Development Data Management Research and Development Data Management 의 약어의 약어 다음과 같은 사항을 관리하는데 사용되는 기술을 뜻함다음과 같은 사항을 관리하는데 사용되는 기술을 뜻함

연구개발과 관련된 모든 정보 연구개발과 관련된 모든 정보 : : 참고문헌참고문헌 , , 중간파일 및 중간결과중간파일 및 중간결과물물 , , 최종결과 및 문서최종결과 및 문서 , , 연구개발에 필요한 시스템 등을 기술하는 연구개발에 필요한 시스템 등을 기술하는 모든 정보모든 정보

연구개발과 관련된 모든 절차 연구개발과 관련된 모든 절차 : : 연구 및 개발 수행과정 상의 연구 및 개발 수행과정 상의 작업절차와 관련된 관리 정보작업절차와 관련된 관리 정보

연구개발 과정에서의 정보의 흐름을 관리하기 위해 관련된 연구개발 과정에서의 정보의 흐름을 관리하기 위해 관련된 컴퓨팅 자원을 통합컴퓨팅 자원을 통합 , , 효율화하는 일련의 작업을 의미효율화하는 일련의 작업을 의미

RDDMRDDM 의 구성요소의 구성요소 정보관리 정보관리 (Information Management)(Information Management) 작업흐름관리 작업흐름관리 (Workflow Management)(Workflow Management) 컴퓨팅 자원 통합 컴퓨팅 자원 통합 (Computing Resource Integration)(Computing Resource Integration)

Page 25: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

25/38

RDDM RDDM 시스템 시스템 Prototype Prototype 연구연구 (2/5)(2/5)- - 개념도 -

Cluster /

Supercomputer

일정관리 (Webcollab)

문서관리 (WebDAV+CVS)

결과문서

참고문헌

중간결과

공유스토리지

RDDM DB

소스코드

Web 기반

Page 26: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

26/38

RDDM RDDM 시스템 시스템 Prototype Prototype 연구연구(3/5)(3/5)

- - 추진 일정 추진 일정 -- 적용분야 및 응용프로그램 선정적용분야 및 응용프로그램 선정

ABAQUS for Structural AnalysisABAQUS for Structural Analysis Fluent for CFD ApplicationFluent for CFD Application

Workflow Workflow 분석 및 분석 및 Metadata Metadata 포맷 결정포맷 결정 구성요소 연구구성요소 연구

정보관리방안 연구정보관리방안 연구 Versioning, Data Versioning, Data 저장 포맷 등저장 포맷 등

작업흐름관리작업흐름관리 일정관리 및 일정관리 및 RDDM RDDM 시스템 사용자 관리 방안시스템 사용자 관리 방안

DB DB 구성구성 Web Interface Web Interface 구성 연구구성 연구 작업분배방안 연구작업분배방안 연구

컴퓨팅 자원으로의 입력 전송 및 계산 결과의 공유 저장컴퓨팅 자원으로의 입력 전송 및 계산 결과의 공유 저장

Page 27: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

27/38

RDDM RDDM 시스템 시스템 Prototype Prototype 연구연구(4/5)(4/5)

- - 추진 일정 추진 일정 -- 적용분야 및 응용프로그램 선정적용분야 및 응용프로그램 선정

ABAQUS for Structural AnalysisABAQUS for Structural Analysis Fluent for CFD ApplicationFluent for CFD Application

Workflow Workflow 분석 및 분석 및 Metadata Metadata 포맷 결정포맷 결정 구성요소 연구구성요소 연구

정보관리방안 연구정보관리방안 연구 Versioning, Data Versioning, Data 저장 포맷 등저장 포맷 등

작업흐름관리작업흐름관리 일정관리 및 일정관리 및 RDDM RDDM 시스템 사용자 관리 방안시스템 사용자 관리 방안

DB DB 구성구성 Web Interface Web Interface 구성 연구구성 연구 작업분배방안 연구작업분배방안 연구

컴퓨팅 자원으로의 입력 전송 및 계산 결과의 공유 저장컴퓨팅 자원으로의 입력 전송 및 계산 결과의 공유 저장

Page 28: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

28/38

RDDM RDDM 시스템 시스템 Prototype Prototype 연구연구(5/5)(5/5) - - 전략 전략 --

RDDM : RDDM : 시스템 구축을 위한 사전연구 및 수요조사시스템 구축을 위한 사전연구 및 수요조사 구현 구현 : 2006: 2006 특히 산업체에서의 컴퓨팅 수요 및 발전 환경 수요조사특히 산업체에서의 컴퓨팅 수요 및 발전 환경 수요조사 해외의 동종 업계의 사례 기술적 분석해외의 동종 업계의 사례 기술적 분석 연말에 이에 대한 보고서 작성 연말에 이에 대한 보고서 작성 (( 응용프로그램 연구와 병행응용프로그램 연구와 병행 ))

웹기반 일정관리 (예 )

Page 29: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

29/38

응용프로그램 성능측정 및 응용프로그램 성능측정 및 시스템 자원 배분 연구시스템 자원 배분 연구

목적 목적 : : 슈퍼컴퓨팅센터내의 컴퓨팅 자원의 효율적 분배를 위한 슈퍼컴퓨팅센터내의 컴퓨팅 자원의 효율적 분배를 위한 각 시스템 및 응용프로그램의 성능 비교각 시스템 및 응용프로그램의 성능 비교

방법방법 슈퍼컴퓨팅센터 응용프로그램 활용도 조사슈퍼컴퓨팅센터 응용프로그램 활용도 조사

사업실 – 시스템 사용율 조사사업실 – 시스템 사용율 조사 응용실 – 응용프로그램 현황 및 버전 조사응용실 – 응용프로그램 현황 및 버전 조사

상용프로그램의 상용프로그램의 nobelnobel 과 과 hamelhamel 에서의 성능 비교에서의 성능 비교 ISV(Independent Software Vendor)ISV(Independent Software Vendor) 로부터 성능 측정용 예제 확보로부터 성능 측정용 예제 확보

Small Size / Medium Size / Large Size Small Size / Medium Size / Large Size 문제 확보문제 확보 Hamel Hamel 및 및 NobelNobel 에서의 성능 비교 및 에서의 성능 비교 및 Scability Scability 측정측정

대표적인 대표적인 Inhouse Inhouse 코드의 코드의 nobel nobel 및 및 hamelhamel 에서의 성능 비교에서의 성능 비교 MD, MD, 천문학코드천문학코드 , , 구조해석구조해석 , CFD, MM5, CFD, MM5

Small Size / Medium Size / Large Size Small Size / Medium Size / Large Size 문제 및 실행 환경 확보문제 및 실행 환경 확보

성능 비교 결과와 활용도 및 라이선스 비용을 종합적으로 고려한 성능 비교 결과와 활용도 및 라이선스 비용을 종합적으로 고려한 사용자 배분 정책 초안 작성사용자 배분 정책 초안 작성

Page 30: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

30/38

Rapid prototyping Rapid prototyping 서비스 클러스터 기술 개발서비스 클러스터 기술 개발 (1/3) (1/3)

슈퍼컴퓨팅분야의 신기술인 클러스터 컴퓨터 운영기술을 슈퍼컴퓨팅분야의 신기술인 클러스터 컴퓨터 운영기술을 적용적용 , , 슈퍼컴퓨팅 실험 결과를 슈퍼컴퓨팅 실험 결과를 3D3D 형태로 출력 할 수 형태로 출력 할 수 있는 있는 Rapid Prototyping Rapid Prototyping 서비스를 원격에서 공유 가능케 서비스를 원격에서 공유 가능케 하는 기술 개발하는 기술 개발

기술적인 목표기술적인 목표 MS MS 윈도우즈 시스템 플랫폼으로 개인용으로 개발된윈도우즈 시스템 플랫폼으로 개인용으로 개발된 슈퍼컴퓨팅 분야 고가의 소프트웨어 및 하드웨어슈퍼컴퓨팅 분야 고가의 소프트웨어 및 하드웨어 , , 관련 실험 장비를 관련 실험 장비를

인터넷을 통하여 공유 활용할 수 있게 하는 사용자 관리 및 어카운인터넷을 통하여 공유 활용할 수 있게 하는 사용자 관리 및 어카운팅팅 , , 자원 수요 중재 미들웨어자원 수요 중재 미들웨어

Page 31: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

31/38

RP(Rapid Prototyping)?RP(Rapid Prototyping)? R.P. (Rapid Prototyping) : 신속조형기술

3 차원 CAD DATA 로부터 박막 적층 기법을 이용하여 물리적인 모형을 신속하게 조형하는 기술

Page 32: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

32/38

Rapid prototyping Rapid prototyping 서비스 클러스터 기술 개발서비스 클러스터 기술 개발 (2/3) (2/3)

서비스 대상서비스 대상

슈퍼컴퓨팅 이용자들 중슈퍼컴퓨팅 이용자들 중 , 3D , 3D 출력이 필요한 연구 그룹출력이 필요한 연구 그룹 (( 교수교수 , , 대학원생대학원생 ) )

부품소재 사업자 등 부품소재 사업자 등 CADCAD 등을 사용하여 제품을 생산하는 중 소 산업체 •등을 사용하여 제품을 생산하는 중 소 산업체 • 공업고등학교와 보수학원공업고등학교와 보수학원 , , 각급 기계설계각급 기계설계 , , 디자인 관련 학과 등의 디자인 관련 학과 등의

슈퍼컴퓨팅 전단계 기술교육을 수행하는 교육기관슈퍼컴퓨팅 전단계 기술교육을 수행하는 교육기관 // 단체 단체 각급 학교의 과학교사 및 과학영재 교육 프로그램 수강자 각급 학교의 과학교사 및 과학영재 교육 프로그램 수강자 게임 퍼블리셔게임 퍼블리셔 , , 독립 모델러독립 모델러 , , 취미생활자취미생활자 , , 발명가 발명가 독립 디자이너 및 소규모 상품 디자인 업체 독립 디자이너 및 소규모 상품 디자인 업체 건축 설계업체 및 건축 모델 제작사 등 건축 설계업체 및 건축 모델 제작사 등 대덕 연구단지 과학관과의 연계 프로그램 대덕 연구단지 과학관과의 연계 프로그램 각급 지자체의 지역 산업 혁신 클러스터 프로그램을 통한 프로모션 각급 지자체의 지역 산업 혁신 클러스터 프로그램을 통한 프로모션 슈퍼컴퓨팅센터의 지역센터 활용 지역관련 산업슈퍼컴퓨팅센터의 지역센터 활용 지역관련 산업 // 교육 지원 사업화 교육 지원 사업화

Page 33: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

33/38

Rapid prototyping Rapid prototyping 서비스 클러스터 기술 개발서비스 클러스터 기술 개발 (3/3) (3/3)

전략전략 PC클러스터 기술에기반한

슈퍼컴퓨팅자원자급기술 개발

배경

클러스터컴퓨팅기술 연구

슈퍼컴퓨팅 기술연구(기본사업)

산업 고도화에 따른국내 산업 디자인

활성화 요구

배경

슈퍼컴퓨팅응용지원기술 개발

슈퍼컴퓨팅활성화 지원

산업 공정 혁신 기술제공을 위한 기반 확보

전/후처리 S/W, H/W공유 기술 개발

산업 디자인 결과물 3D출력 서비스 확보

지역산업 활성화지원 기반 확보

슈퍼컴퓨팅 센터활동 분야/영역확대

일반인 대상 우수홍보물 확보

수탁

국가사업화

Page 34: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

34/38

네트워크 에뮬레이션 클러스터 구축네트워크 에뮬레이션 클러스터 구축 (1/2)(1/2) 개요개요

네트워크 네트워크 R&D R&D 지원을 위한 개방형 테스트베드지원을 위한 개방형 테스트베드 시뮬레이션이 아닌 시뮬레이션이 아닌 REAL REAL 트래픽트래픽 // 네트워크네트워크 // 시스템을 통한 네트워크 시스템을 통한 네트워크 R&DR&D

동향동향 NSF NSF 및 및 DARPA DARPA 의 지원 의 지원 (( 미국미국 )) 운영중인 사이트 운영중인 사이트 (( 미국미국 ))

U. Utah, Georgia Tech, U. Kentucky, U. wisconsinU. Utah, Georgia Tech, U. Kentucky, U. wisconsin Cornell, U. Texas at Austin, USC, UC BerkeleyCornell, U. Texas at Austin, USC, UC Berkeley The Aerospace CorporationThe Aerospace Corporation

KISTI Supercomputing Center KISTI Supercomputing Center 40 40 노드 구성 중노드 구성 중

University of Utah University of Wisconsin

University of Kentucky

Page 35: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

35/38

네트워크 에뮬레이션 클러스터 구축네트워크 에뮬레이션 클러스터 구축 (2/2)(2/2)

구축 현황구축 현황 U. Kentucky U. Kentucky 를 벤치 마킹를 벤치 마킹 20052005 년 현재년 현재

유타대학 방문 및 기술 협력 요청유타대학 방문 및 기술 협력 요청 구조물 제작구조물 제작 , 40, 40 노드 구매노드 구매 , , 핵심 핵심

스위칭 장비 구매 완료스위칭 장비 구매 완료 제어 및 관리 서버 미들웨어 설치 중제어 및 관리 서버 미들웨어 설치 중

향후 계획향후 계획 20052005 년 상반기 년 상반기

시스템 구축 완료 시스템 구축 완료 (( 배선 및 서버 설치배선 및 서버 설치 )) 미들웨어 설치 완료미들웨어 설치 완료 방화벽 설치 완료방화벽 설치 완료

20052005 년 하반기년 하반기 테스트 및 시범 서비스테스트 및 시범 서비스

서비스 대상서비스 대상 대학 및 연구소의 네트워크 대학 및 연구소의 네트워크 R&D R&D 연구 연구

및 수업및 수업 네트워크 네트워크 R&D R&D 관련 논문 시뮬레이션관련 논문 시뮬레이션 산업체의 네트워크 관련 기술 개발산업체의 네트워크 관련 기술 개발

University of Kentucky

4506(6509)(4*48 Port)

제어서버

관리서버

NodeNode

40 nodes

구성도

Page 36: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

36/38

기대 효과기대 효과

클러스터 컴퓨팅 핵심 기술 개발 차기 클러스터 컴퓨터 구축을 위한 기반 기술 체계적인 클러스터 컴퓨터 관리 및 운영 소프트웨어 , 파일 서비스 기술 개발 및 확보

핵심기술

클러스터 컴퓨팅 확대를 통한 산업 활성화 클러스터 기술 센터 운영을 통한 기술 교류 방안 확보 응용분야 확산을 통한 수요층 증대

산업활성화

상용코드 / 인하우스 코드 성능과 사용자 정책을 위한 자료 확보 클러스터 컴퓨터의 효용성과 서비스 방식 개선을 전용 서비스 모델 확보

서비스개발

Page 37: 슈퍼컴퓨팅센터의  클러스터 컴퓨팅 주제

37/38

감사합니다감사합니다 ..