Microsofts Phi-2-Modell auf MIT-Lizenz umgestellt

(huggingface.co)

2 Punkte von GN⁺ 2024-01-08 | 1 Kommentare | Auf WhatsApp teilen

Im Commit 7e10f3e des Hugging Face-Repositorys von Phi-2 wurden die drei Dateien LICENSE, NOTICE.md und README.md geändert, wodurch die Lizenzangabe auf MIT umgestellt wurde
Die neue LICENSE wurde durch den vollständigen Text der MIT License ersetzt und erlaubt damit in großem Umfang Nutzung, Kopieren, Modifizieren, Verbreiten, Relizenzieren und Verkaufen
Mehrere Klauseln der bisherigen Microsoft Research License wurden entfernt, darunter das Verbot von Reverse Engineering, Beschränkungen für unabhängiges Hosting, Vorgaben zur Verarbeitung personenbezogener Daten, Schiedsverfahren und Haftungsbeschränkungen
Die README-Metadaten verwenden statt license_name: microsoft-research-license nun license: mit, während der bisherige LICENSE-Link bestehen bleibt
Die neue NOTICE.md weist flash-attention als Drittanbieterkomponente aus und enthält die BSD 3-Clause License sowie einen Hinweis auf zulässiges eingeschränktes Reverse Engineering zum Debugging von Änderungen an LGPL-Bibliotheken

Im Commit geänderte Dateien

Der Commit im Hugging Face-Repository microsoft/phi-2 wird als „Upload 3 files“ angezeigt; geändert wurden die drei Dateien LICENSE, NOTICE.md und README.md
Unter Browse files lässt sich die Dateiliste dieses Commit-Stands einsehen

LICENSE: Wechsel von Microsoft Research License zu MIT License

Die LICENSE-Datei wurde geändert: Der bisherige Lizenztext wurde entfernt und durch den vollständigen Text der MIT License ersetzt
Die neue LICENSE enthält nach den Formulierungen PhyAGI. und Copyright (c) Microsoft Corporation. die MIT License
Die MIT License gewährt jeder Person, die die Software und die zugehörigen Dokumentationsdateien erhält, kostenlos folgende Rechte
- Nutzung, Kopieren, Modifizieren, Zusammenführen
- Veröffentlichen, Verbreiten, Relizenzieren
- Verkauf von Kopien der Software
- Einräumung derselben Rechte an Empfänger der Software
Voraussetzung ist, dass der Copyright-Hinweis und der Erlaubnishinweis in allen Kopien oder wesentlichen Teilen der Software enthalten sind
Der Gewährleistungsausschluss ist in AS IS-Form enthalten und schließt ausdrückliche wie stillschweigende Garantien aus, einschließlich Marktgängigkeit, Eignung für einen bestimmten Zweck und Nichtverletzung von Rechten
Urheberrechtsinhaber und Rechteinhaber haften nicht für Ansprüche, Schäden oder sonstige Verpflichtungen, die aus der Nutzung der Software oder anderen Vorgängen damit entstehen

Entfernte bisherige Einschränkungen

Aus der bisherigen LICENSE wurden mehrere Beschränkungen und rechtliche Klauseln entfernt
Zu den gestrichenen Bestimmungen gehörten unter anderem
- Verbot von Reverse Engineering, Dekompilierung und Disassemblierung des Materials
- Verbot, Hinweise von Microsoft oder Lieferanten zu entfernen, zu verkleinern, zu blockieren oder zu verändern
- Verbot der Nutzung in rechtswidriger Weise oder zum Erstellen bzw. Verbreiten von Schadsoftware
- Verbot des Teilens, Veröffentlichens, Verbreitens oder Vermietens des Materials, des Angebots unabhängiger Hosting-Lösungen sowie der Übertragung an Dritte
Ebenfalls entfallen sind Beschränkungen zu personenbezogenen Daten
- Personenbeziehbare Daten durften nicht für andere als genehmigte oder eingewilligte Zwecke verwendet werden
- Sie durften nicht verwendet werden, um Kontakt mit Einzelpersonen aufzunehmen
- Nach Abschluss der Forschung mussten personenbezogene Daten sowie Backups und Kopien unverzüglich vernichtet werden
Ebenfalls gestrichen wurde eine Klausel, nach der Microsoft bei Bereitstellung von Änderungen durch Nutzer eine weitreichende Lizenz erhält
Darüber hinaus wurden Klauseln zu Veröffentlichung, Feedback, Exportbeschränkungen, Supportleistungen, Schiedsverfahren in den USA und Verzicht auf Sammelklagen, anwendbarem Recht, Verbraucherrechten, Gewährleistungsausschluss und Haftungsbegrenzung entfernt

Änderungen an den README-Metadaten

In den Frontmatter-Daten von README.md wurde die Lizenzangabe geändert
Entfernt wurden die folgenden Einträge
- license:
- license_name: microsoft-research-license
Neu hinzugekommen ist license: mit
license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSE bleibt bestehen
inference: false und language: - en bleiben im angezeigten Diff unverändert

NOTICE.md und Hinweise zu Drittanbieterkomponenten

Die neue Datei NOTICE.md beginnt mit den Formulierungen „NOTICES AND INFORMATION“ und „Do Not Translate or Localize“
Microsoft erklärt darin, dass diese Software Materialien Dritter enthält
Ein Teil des Open-Source-Codes von Microsoft wird unter https://3rdpartysource.microsoft.com bereitgestellt oder kann durch Zusendung eines Schecks oder einer Zahlungsanweisung über 5,00 US-Dollar zusammen mit Produktname, Name der Open-Source-Komponente, Plattform und Versionsnummer angefordert werden
Unabhängig von anderen Bedingungen darf diese Software in dem Umfang reverse engineered werden, der zum Debugging von Änderungen an Bibliotheken erforderlich ist, die unter der GNU Lesser General Public License lizenziert sind
Als Komponente ist flash-attention enthalten
Der Hinweis zu flash-attention enthält die BSD 3-Clause License
- Bei Weiterverbreitung des Quellcodes müssen Copyright-Hinweis, Liste der Bedingungen und Haftungsausschluss erhalten bleiben
- Bei Weiterverbreitung in Binärform müssen dieselben Hinweise, Bedingungen und Haftungsausschlüsse in der Dokumentation oder anderen Materialien enthalten sein
- Ohne vorherige schriftliche Genehmigung dürfen die Namen der Urheberrechtsinhaber oder Mitwirkenden nicht zur Bewerbung abgeleiteter Produkte verwendet werden
Der BSD-3-Clause-Hinweis erklärt außerdem, dass auch diese Software AS IS bereitgestellt wird und keine Haftung für direkte, indirekte, zufällige, besondere, exemplarische oder Folgeschäden übernommen wird

1 Kommentare

GN⁺ 2024-01-08

Meinungen auf Hacker News

Es ist wirklich spannend, dass solche offenen Modelle erscheinen.
Interessant ist, dass AI-„Ethiker“ sich gern wie eine Hohepriesterschaft aufführen würden, die im Namen der Sicherheit den Zugang zu Machine-Learning-Modellen kontrolliert. Meiner Ansicht nach liegt das größte Risiko von AI aber darin, dass diejenigen, die die Modelle kontrollieren, auch kontrollieren und zensieren, was Menschen mit ihnen schreiben dürfen.
Ich denke, Open-Source-Modelle in den Händen der Öffentlichkeit sind die beste Verteidigung gegen die wirklichen Risiken von AI, und ich applaudiere Facebook, Microsoft und Mistral dafür, dass sie das vorantreiben.
- AI-„Ethiker“ so zu sehen, ist eine viel zu böswillige Auslegung.
  Man sollte lieber die tatsächlichen Argumente lesen statt Social-Media-Zusammenfassungen. Die Diskussion ist deutlich tiefgehender, als man denkt, behandelt auch die Risiken, über die man sich Sorgen macht, umfassend, und es gibt vorgeschlagene Lösungsansätze. Diese Lösungen haben eine größere Chance, tatsächlich zu funktionieren, als die Behauptung, dies sei die „beste Verteidigung“.
- „Alle“ AI-Ethiker als Priesterkaste darzustellen, die den Zugang zu Modellen verhindern will, halte ich für schädlich.
  Es gibt viele Menschen, denen sowohl die Demokratisierung solcher Tools als auch ihre sichere und ethische Nutzung wichtig sind.
- Ich denke, inzwischen ist die Katze aus dem Sack.
  Zu erwarten, dass Leute mit schlechten Absichten Lizenztexte einhalten, war als Kontrollmechanismus von Anfang an keine gute Idee. Es bremst nur Fortschritt und Innovation bei Menschen, die wohlmeinend genug sind, sich an Gesetze zu halten; Akteure mit anderen Absichten in Ländern wie Russland, Nordkorea oder China sowie kriminelle Organisationen und Betrüger fühlen sich von solchen Vorstellungen nicht gebunden.
  Die Community, die unter echten Open-Source-Lizenzen arbeitet, wächst, und spannende Dinge passieren immer schneller. Alternative Lizenzen sind wenig wirksam, kappen die Verbindung zu dieser Community, verkomplizieren Zusammenarbeit und werden in der gesamten Forschung zunehmend zur Minderheitsposition. Dadurch werden solche Lizenzen immer bedeutungsloser.
  Wenn man das korrigiert, wird der Zustand aus juristischer Sicht einfacher und standardisierter, was Kommerzialisierung, Zusammenarbeit und Forschung erleichtert. Microsoft scheint vernünftigerweise anzuerkennen, dass darin Wert liegt, und passt sich der Realität an.
- Wer kann garantieren, dass der eigentliche verdeckte Zweck dieser irrsinnigen AI-Investitionen nicht darin besteht, eine groß angelegte Zensurinfrastruktur aufzubauen?
- Überall dort, wo sich Wert sammelt, entsteht eine Seepocken-Industrie, die den Fuß auf die Bremse legt, wenn man keiner Armee von Menschen, die nichts beitragen, Abgaben zahlt.
Früher war es eine nichtkommerzielle Lizenz, daher war die Erwartung etwas gedämpft.
Angesichts von Leistung und Größe ist der Wechsel zu einer kommerziell freundlichen Lizenz ein ziemlich großes Ereignis.
Entscheidend ist, dass dieses Modell über starke Reasoning-Fähigkeiten verfügt.
Allerdings wurde es absichtlich nicht mit großen Web-Crawling-Datensätzen trainiert, damit man nicht lernt, wie man Bomben baut oder „böse Dinge“ tut.
Deshalb ist es im Vergleich zu Modellen derselben Größenklasse oder sogar mit mehr Parametern das Modell, das „am klügsten denkt“, hat aber relativ wenig Weltwissen oder Allgemeinwissen.
Das könnte sich künftig ändern, aber so sehe ich den aktuellen Stand.
- Für RAG-Anwendungen ist es trotzdem hervorragend.
  Denn ich möchte, dass Antworten auf den von mir bereitgestellten Daten basieren und nicht auf Dingen, die es aus dem Web gelernt hat.
- Wenn man große Sprachmodelle anhand zweier Eigenschaften betrachtet – der Fähigkeit, natürliche Sprache zu verwenden, und dem Wissen, Fragen zu beantworten –, dann kann man kleine Sprachmodelle als sehr gute Modelle für Natural Language Processing betrachten.
  Für viele Aufgaben braucht man kein Allgemeinwissen, und gerade bei RAG ist dieser Vorteil groß.
- Ich hoffe, der Fokus des Modells liegt nicht darauf, Daten einzubauen.
  Daten sollte man besser per Retrieval bereitstellen, und dadurch gibt es weniger Antworten, die „plausibel klug wirken, aber völlig falsch“ sind.
  Wenn weniger Daten eingebettet sind, lässt sich das Modell auch außerhalb des Bereichs von Chat-Assistenten allgemeiner einsetzen. Oft will man nämlich, dass das Modell nur die Daten kennt, die der Nutzer bereitgestellt hat.
  Wenn zum Beispiel in einem mittelalterlichen Fantasy-Spiel eine Figur plötzlich anfängt, über US-Politik zu reden, wäre das sehr seltsam. Auch Phi-2 löst das ohne Fine-Tuning nicht vollständig, aber darum geht die Richtung.
- Dass es nicht mit Web-Crawling-Daten trainiert wurde, soll meiner Meinung nach weniger offensichtlich wirken lassen, dass Microsoft Eigentum und personenbezogene Daten stiehlt, um sie zu monetarisieren.
Mich interessiert eher der Datensatz als das Modell.
- Wahrscheinlich ist es eine Weiterentwicklung der Trainingsmethode „Textbooks are all you Need“ von phi-1/1.5: https://arxiv.org/abs/2309.05463
Eine großartige Änderung, die auch zeigt, warum unabhängige Open-Source-Projekte wichtig sind.
Es ist schwer zu glauben, dass die Veröffentlichung von TinyLlama unter der Apache-2.0-Lizenz keinen Einfluss auf diese Änderung hatte.
- Worauf stützt sich die Annahme, dass die Veröffentlichung von TinyLlama Einfluss hatte?
Das wirkt wie ein Signal, dass Phi-3 und die nächsten Modellgenerationen Phi-2 veralten lassen werden.
Dieses Modell war ziemlich lange weit oben in den Rankings; was ist daran so gut?
- Gemessen an der Modellgröße und den Inference-Kosten ist die Leistung hervorragend.
  Es ist das beste Modell, das auch auf kleinen Geräten wie Smartphones laufen kann und dabei eine Leistung nahe an GPT-3.5 erreicht.
  Auch Architektur und Trainingsdaten sind interessant. Es ist ein Sparse Model, das kuratierte synthetische Daten verwendet und dadurch eine deutlich höhere Genauigkeit erreicht als Modelle, die mit zufälligem Internettext trainiert wurden.

Microsofts Phi-2-Modell auf MIT-Lizenz umgestellt

Im Commit geänderte Dateien

LICENSE: Wechsel von Microsoft Research License zu MIT License

Entfernte bisherige Einschränkungen

Änderungen an den README-Metadaten

NOTICE.md und Hinweise zu Drittanbieterkomponenten

Verwandte Beiträge

1 Kommentare

Meinungen auf Hacker News