무료 가이드: 「LLM을 제로부터 훈련하기 위한 모범 사례」

참고: 영어 버전이 필요한 경우, 여기를 통해 확인해 주세요. 세계 선두의 대규모 언어 모델(LLM) 개발 팀 중 많은 팀이 Weights & Biases를 이용해 모델 학습을 수행하고 있습니다. 우리가 지금까지 축적해온 LLM 개발 노하우를 공유합니다.
  • LLM을 자체 개발할지 기존 모델을 추가 학습할지 결정하는 방법
  • 경쟁력 있는 LLM을 개발하기 위해 얼마나 많은 데이터가 필요한지
  • 병렬 처리에서 메모리와 계산 효율성의 균형을 맞추는 방법
  • 텍스트 데이터의 토큰화 전략과 그에 따른 트레이드오프
  • 모델 평가 방법
  • 편향이나 유해성을 제거하는 튜닝 방법 등
W&B는 LLM과 같이 복잡하고 비용이 많이 드는 모델의 개발과 실용화에 필요한 협업을 가능하게 합니다. 무료 가이드를 원하시는 분은 오른쪽에 정보를 등록해 주세요. 이메일로 다운로드 링크를 전송해 드리겠습니다.
LLM Whitepaper: Japanese

최첨단 LLM 을 구축하는 팀의 신뢰

63a1d5b515c30eedb1288e05_Meta AI-p-500
Heinrich Kuttler 리서치 엔지니어 – Facebook AI Researcher 
우리에게 Weights&Biases는 게임 체인저였습니다. 간단하게 결과를 공유하고, 흥미로운 동작에 주석을 달며, 로그 데이터를 장기 보존하면서 AI 실험을 신속하게 반복할 수 있는 MLOps 도구는 Weights&Biases 뿐입니다.
63a0aabb80eaa279104f09f2_OpenAI
Peter Welinder 제품 담당 부사장 – OpenAI
우리는 거의 모든 모델 학습에 W&B를 사용하고 있습니다.
639d875f882c7f2e334d36da_Cohere-p-500 1
Ellie Evans 프로덕트 매니저ー Cohere
W&B를 사용하면 모든 후보 모델을 한 번에 검토할 수 있습니다. 각 고객에게 어떤 모델이 최적인지를 이해하는 데 필수적이며, 해당 보고서는 우리에게도 매우 유용했습니다. 보고서를 통해 기술 정보를 원활하게 공유할 수 있습니다.

확장성 및 안전성

당사는 대규모 분산 교육으로 확장 가능한 솔루션을 제공하며, 보안이 강화된 당사의 호스팅 클라우드에서 호스팅하거나 고객이 자체적으로 프라이빗 클라우드에 셀프 호스팅 방식으로 배포할 수 있습니다.

Weights & Biases를 사용하면 가능합니다.

중요한 개발자 리소스를 핵심 비즈니스에 집중시킬 수 있습니다.
새로운 머신러닝 모델을 더 빠르게 시작하고 번거로운 작업을 줄일 수 있습니다.

중앙 기록 시스템으로 IP를 보호합니다.

새로운 ML 엔지니어를 신속하게 온보딩하고 중복 작업을 피할 수 있습니다.

Casestudy 와 TRI

개요

도요타 연구소의 사명은 세계에서 가장 안전한 이동 수단을 구축하는 것입니다. TRI의 기계 학습 팀은 자율 주행을 추구하고 있으며, 모델을 재현 가능하게 만들기 위해 Weights & Biases의 시스템을 사용합니다.
  • 회사 규모: 300+
  • 산업: 자율주행차
606b32d0ccaf0d7fa8fa4759_weights-biases-overview-1
606b32d0ccaf0d14c1fa4761_weights-biases-overview-2

문제

Adrien Gaidon이 이끄는 ML 팀은 학습 모델을 위한 세계적 수준의 인프라를 구축했지만 결과를 추적하고 버전을 지정하는 좋은 방법이 부족했습니다.
중앙 기록 시스템의 필요성을 빠르게 깨달았지만 내부적으로 해결책을 구축하는 것이 팀의 핵심목표는 아니었습니다
“현재 머신러닝이 얼마나 신뢰할 수 있을지에 대해 통계적이든 아니든 어떤 보장도 제공하기가 정말 어렵습니다. 안전이 중요한 시스템을 도입하려면 실제로 작동해야 합니다. 생명을 위험에 빠뜨리지 않는 안전한 자동차를 만들려면 어떻게 해야 할까요?”
60397202aae3c11eec4a1b46_case-study-author
Adrien Gaidon
Toyota Research Institute

솔루션

TRI 팀은 문제를 해결하기 위해 다양한 솔루션을 비교한 끝에 Weights & Biases를 최고의 플랫폼으로 선택했습니다.
ML 팀은 실험 추적 및 예측 시각화를 위해 취약한 내부 도구와 임시 솔루션을 사용하는 대신 W&B의 경량 실험 추적 및 시각화 솔루션을 사용하여 표준화할 수 있었습니다.
W&B 대시보드는 머신 러닝 실무자에게 데이터셋과 모델 버전을 비교할 수 있는 명령 센터를 제공하여 모든 실험과 결과에 대한 신뢰할 수 있는 기록을 유지합니다. ML 엔지니어는 이제 모델 개발이라는 귀중한 작업에 자유롭게 집중하여 프로젝트 진행을 가속화할 수 있습니다.
606b32d0ccaf0ddd78fa475c_weights-baises-solution
“안전 표준이 매우 높기 때문에 공공 도로에서 테스트하기가 매우 어려운 로봇 시스템이나 자율 주행 자동차가 있는 경우 측정 기준을 명확하게 정의해야 하지만 동시에 지속적인 배포와 빠른 반복을 원합니다.”
60397202aae3c11eec4a1b46_case-study-author

Adrien Gaidon

Toyota Research Institute

Join the top innovators around the world using Weights & Biases

60c2afebcc3a965ba83f9124_nvidia
60c2afedf9f58f3dc3b9be4c_salesforce
6053d0ae5b5d728c0c3b930e_weights-biases-innovators-github-logo