[CTO] NPU Software Engineer근무지
모레 오피스서울특별시 서초구 서초대로 396, 강남빌딩 20층 [직무 소개]
- 모레는 기존 AI 인프라의 한계를 뛰어넘기 위해, 하드웨어와 소프트웨어를 아우르는 새로운 시스템을 개발합니다.
- NPU 소프트웨어 엔지니어는 이 시스템에서 가속기의 성능을 극대화하는 핵심 역할을 맡습니다.
- AI 워크로드의 특성과 NPU 아키텍처를 함께 고려해, 최적화된 커널을 설계하고 구현합니다.
[주요 업무]
- 각종 인공신경망 레이어 및 텐서 연산들을 NPU 프로그래밍 모델로 구현하고 최적화
- 텐서 연산과 다양한 가속기에 대한 성능 예측 및 분석 모델 개발
- 다양한 NPU 아키텍처를 대상으로 최적의 커널 코드를 생성, 선택하기 위한 코드 생성기와 오토 튜너 개발
- AI 애플리케이션에 특화된 NPU의 구성 요소들(FPU/SFPU 유닛, NPU 간 전용 인터커넥션 등)을 활용
- NPU 간의 효율적인 통신 라이브러리 개발 (서로 다른 노드에 위치한 NPU 사이의 통신을 포함)
[자격 요건]
- 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분
- C/C++ 및 Python 개발이 가능하신 분
- 제조사에 무관하게 NPU, GPU, FPGA, DSP, PIMM 등 가속기에 대한 경험이 있으신 분
- 컴퓨터 시스템에 대한 깊은 이해
[우대사항]
- 컴퓨터 시스템 혹은 관련 분야 석/박사 졸업
- 각종 AI/HPC 애플리케이션을 가속기에서 병렬화/최적화해 본 경험 및 관련 논문 개제 이력
- 통신 라이브러리(MPI, NCCL, Verbs, RDMA 등)를 사용해 가속기 클러스터에서 동작하는 프로그램을 개발해 본 경험
- C++ 기반의 대규모 소프트웨어 개발에 참여한 이력
- 딥 러닝에 대한 기본적인 지식, PyTorch 혹은 TensorFlow 사용 경험
- 인공신경망 모델을 딥 러닝 프레임워크 없이 직접 구현해 본 경험
- 주요 학술대회에 논문 게재 이력(예: ASPLOS, HPDC, ISCA, Micro, PACT, PLDI, PPoPP, SC) 및 기타 연구 경력
[복지 제도]
- 복지포인트 연간 200만 원
- 입사 시 장비지원금 지원
- 유연출근제&재택근무
- 연 1회 종합건강검진 (본인 및 직계가족 1인)
- 생일 반차 휴가
- 사내 동호회 지원 (보드게임, 방탈출, 클라이밍 등)
- 오피스 간식 제공(과자, 음료수 등)
- 연말 오피스 클로징 (매년 12/28-12/31 유급휴가 제공)
- 중소기업 청년 소득세 감면 (연간 200만 원)
[채용 절차]
- 서류 전형 -> 1차 면접 -> 최종 면접 -> 처우 협의 -> 최종 합격
[CTO] NPU Software Engineer[직무 소개]
- 모레는 기존 AI 인프라의 한계를 뛰어넘기 위해, 하드웨어와 소프트웨어를 아우르는 새로운 시스템을 개발합니다.
- NPU 소프트웨어 엔지니어는 이 시스템에서 가속기의 성능을 극대화하는 핵심 역할을 맡습니다.
- AI 워크로드의 특성과 NPU 아키텍처를 함께 고려해, 최적화된 커널을 설계하고 구현합니다.
[주요 업무]
- 각종 인공신경망 레이어 및 텐서 연산들을 NPU 프로그래밍 모델로 구현하고 최적화
- 텐서 연산과 다양한 가속기에 대한 성능 예측 및 분석 모델 개발
- 다양한 NPU 아키텍처를 대상으로 최적의 커널 코드를 생성, 선택하기 위한 코드 생성기와 오토 튜너 개발
- AI 애플리케이션에 특화된 NPU의 구성 요소들(FPU/SFPU 유닛, NPU 간 전용 인터커넥션 등)을 활용
- NPU 간의 효율적인 통신 라이브러리 개발 (서로 다른 노드에 위치한 NPU 사이의 통신을 포함)
[자격 요건]
- 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분
- C/C++ 및 Python 개발이 가능하신 분
- 제조사에 무관하게 NPU, GPU, FPGA, DSP, PIMM 등 가속기에 대한 경험이 있으신 분
- 컴퓨터 시스템에 대한 깊은 이해
[우대사항]
- 컴퓨터 시스템 혹은 관련 분야 석/박사 졸업
- 각종 AI/HPC 애플리케이션을 가속기에서 병렬화/최적화해 본 경험 및 관련 논문 개제 이력
- 통신 라이브러리(MPI, NCCL, Verbs, RDMA 등)를 사용해 가속기 클러스터에서 동작하는 프로그램을 개발해 본 경험
- C++ 기반의 대규모 소프트웨어 개발에 참여한 이력
- 딥 러닝에 대한 기본적인 지식, PyTorch 혹은 TensorFlow 사용 경험
- 인공신경망 모델을 딥 러닝 프레임워크 없이 직접 구현해 본 경험
- 주요 학술대회에 논문 게재 이력(예: ASPLOS, HPDC, ISCA, Micro, PACT, PLDI, PPoPP, SC) 및 기타 연구 경력
[복지 제도]
- 복지포인트 연간 200만 원
- 입사 시 장비지원금 지원
- 유연출근제&재택근무
- 연 1회 종합건강검진 (본인 및 직계가족 1인)
- 생일 반차 휴가
- 사내 동호회 지원 (보드게임, 방탈출, 클라이밍 등)
- 오피스 간식 제공(과자, 음료수 등)
- 연말 오피스 클로징 (매년 12/28-12/31 유급휴가 제공)
- 중소기업 청년 소득세 감면 (연간 200만 원)
[채용 절차]
- 서류 전형 -> 1차 면접 -> 최종 면접 -> 처우 협의 -> 최종 합격