Kostenloses Whitepaper: „Best Practices für das Training eines LLM von Grund auf“

Hinweis: Wenn Sie die englischsprachige Version dieses Whitepapers wünschen, können Sie hier darauf zugreifen.</ p> Viele der weltweit führenden Entwicklungsteams für große Sprachmodelle (LLM) verwenden Gewichtungen und Verzerrungen, um ihre Modelle zu trainieren. In diesem Whitepaper teilen wir das LLM-Entwicklungs-Know-how, das wir im Laufe der Jahre gesammelt haben:
  • Wie entscheidet man, ob man ein LLM intern entwickelt oder ein bestehendes Modell zusätzlich trainiert?
  • Wie viele Daten werden benötigt, um ein wettbewerbsfähiges LLM zu entwickeln?
  • Wie um Speicher und Recheneffizienz bei der Parallelverarbeitung in Einklang zu bringen
  • Strategien und Kompromisse für die Tokenisierung von Textdaten
  • Wie man Modelle bewertet
  • Optimierungsmethoden zur Beseitigung von Verzerrungen und Schädlichkeit
  • Und so weiter

W&B ermöglicht die Zusammenarbeit, die für die Entwicklung und Kommerzialisierung komplexer und kostspieliger Modelle wie LLM erforderlich ist. Um Ihr kostenloses Whitepaper zu erhalten, klicken Sie auf den Download-Link in der E-Mail, die Sie nach der Registrierung mit dem Formular auf der rechten Seite erhalten.

LLM Whitepaper: Japanese

Vertrauenswürdig für die Teams, die hochmoderne LLMs entwickeln

63a1d5b515c30eedb1288e05_Meta AI-p-500
Heinrich Kuttler
Research Engineer – Facebook AI Research

„Für uns war Weights and Biases ein Wendepunkt. Kein anderes verfügbares MLOps-Tool ermöglicht eine schnelle Iteration von KI-Experimenten mit der gleichen Leichtigkeit beim Teilen von Ergebnissen, Kommentieren interessanten Verhaltens und der langfristigen Speicherung von Protokolldaten.“

63a0aabb80eaa279104f09f2_OpenAI
Peter Welinder
VP of Product – OpenAI

„Wir verwenden W&B für so ziemlich unser gesamtes Modelltraining.“

639d875f882c7f2e334d36da_Cohere-p-500 1
Ellie Evans
Produktmanagerin – Cohere

„Mit W&B können wir alle unsere Kandidatenmodelle auf einmal untersuchen. Das ist wichtig, um zu verstehen, welches Modell für welchen Kunden am besten geeignet ist. Die Berichte waren [auch] großartig für uns. Sie ermöglichen uns die nahtlose Kommunikation nuancierter technischer Informationen auf eine Weise, die für nicht-technische Teams verständlich ist.“

Skalierbar und sicher

Wir bieten Lösungen, die mit massivem verteiltem Training skalierbar sind und in unserer sicheren gehosteten Cloud oder in einer selbstgehosteten Bereitstellung in Ihrer eigenen privaten Cloud gehostet werden können.

Mit Weights & Biases können Sie:

Konzentrieren Sie wichtige Entwicklerressourcen auf Ihr Kerngeschäft

Neue Machine-Learning-Modelle schneller und mit weniger Hin und Her einführen

Schützen Sie geistiges Eigentum mit einem zentralen Aufzeichnungssystem

Neue ML-Ingenieure schnell an Bord holen und Doppelarbeit vermeiden

Eine Fallstudie mit TRI

Überblick

Die Mission des Toyota Research Institute ist es, die sicherste Mobilität der Welt zu schaffen. Die Machine-Learning-Teams am TRI arbeiten am autonomen Fahren und verwenden das Weights & Biases-Aufzeichnungssystem, um ihre Modelle reproduzierbar zu machen.

  • Unternehmensgröße: 300+
  • Branche: Autonome Fahrzeuge
606b32d0ccaf0d7fa8fa4759_weights-biases-overview-1
606b32d0ccaf0d14c1fa4761_weights-biases-overview-2

Problem

Led by Adrien Gaidon, the ML team built up world-class infrastructure for training models, but lacked a good way to track and version the valuable results.

Ihnen wurde schnell klar, dass ein zentrales Aufzeichnungssystem erforderlich war. Die interne Entwicklung einer Lösung lenkte das Team jedoch von seinen Kernzielen ab.

„Es ist derzeit wirklich schwierig, beim maschinellen Lernen irgendwelche statistischen oder sonstigen Garantien für seine Zuverlässigkeit zu geben. Wenn man ein sicherheitskritisches System einbaut, muss es wirklich funktionieren. Wie können wir es sicher genug machen, damit wir es in Autos einbauen und Leben retten können, anstatt sie zu gefährden?“

60397202aae3c11eec4a1b46_case-study-author
Adrien Gaidon

Toyota-Forschungsinstitut

Lösung

Das TRI-Team verglich verschiedene Lösungen für sein Experimentverfolgungsproblem und entschied sich für Weights & Biases als beste Plattform zur Koordinierung von Machine-Learning-Projekten.

Anstatt mit instabilen internen Tools und Ad-hoc-Lösungen für die Experimentverfolgung und Vorhersagevisualisierung herumzubasteln, konnte das ML-Team mit den leichtgewichtigen Experimentverfolgungs- und Visualisierungslösungen von W&B eine Standardisierung durchführen.

Das W&B-Dashboard gab Machine-Learning-Experten eine Kommandozentrale an die Hand, um Datensätze und Modellversionen zu vergleichen und eine zuverlässige Aufzeichnung aller Experimente und Ergebnisse zu führen. ML-Ingenieure können sich nun auf die wertvolle Arbeit der Modellentwicklung konzentrieren und so den Projektfortschritt beschleunigen.

606b32d0ccaf0ddd78fa475c_weights-baises-solution

„Sie müssen die Maßstäbe klar definieren, wenn Sie beispielsweise ein Robotersystem oder ein selbstfahrendes Auto haben, das sich aufgrund der sehr hohen Sicherheitsstandards nur äußerst schwer auf öffentlichen Straßen testen lässt. Gleichzeitig wollen Sie aber eine kontinuierliche Bereitstellung und schnelle Iteration.“

60397202aae3c11eec4a1b46_case-study-author

Adrien Gaidon

Toyota-Forschungsinstitut

Schließen Sie sich den Top-Innovatoren der Welt an und nutzen Sie Weights & Biases

60c2afebcc3a965ba83f9124_nvidia
60c2afedf9f58f3dc3b9be4c_salesforce
6053d0ae5b5d728c0c3b930e_weights-biases-innovators-github-logo