- Positron ist die von Posit, dem Unternehmen hinter RStudio, neu entwickelte IDE der nächsten Generation speziell für Data Science
- Diese IDE unterstützt R und Python standardmäßig und ist als mehrsprachige (polyglotte) Plattform konzipiert, die sich für Data-Science-Umgebungen eignet, in denen mehrere Sprachen gemeinsam genutzt werden
- Architektonisch basiert sie auf Code OSS von VS Code und bietet damit eine vertraute Umgebung und umfangreiche Erweiterbarkeit, ergänzt um auf Data Scientists spezialisierte Funktionen wie Plots, Variablen, Hilfe und Data Explorer
- Mit dem neuen R-Kernel Ark und der Tree-sitter-R-Syntaxunterstützung wurden Codeausführung, Autovervollständigung, Debugging und Dokumentationsnavigation deutlich verbessert; sogar das Debugging von gemischtem R- und C++-Code ist möglich
- RStudio wird weiterhin stabil gepflegt und unterstützt, doch Positron dürfte sich dank Mehrsprachigkeit, Erweiterbarkeit und moderner Architektur langfristig als Zentrum der Data-Science-Entwicklungsumgebung etablieren
Einführung in Positron und warum es gebraucht wird
- Als IDE speziell für Data Science bietet es im Unterschied zu allgemeinen Softwareentwicklungs-IDEs eine auf datenanalytische Arbeit zugeschnittene Erfahrung
- Statt eines GUI-zentrierten Tools verfolgt es einen code-first-Ansatz und schafft damit eine Umgebung, die Produktivität und Reproduzierbarkeit erhöht
- Es überwindet die Beschränkung bestehender IDEs (RStudio, Spyder, MATLAB usw.), die auf einzelne Sprachen ausgerichtet waren, und eignet sich für reale Workflows, in denen mehrere Sprachen gemischt verwendet werden
Hauptmerkmale
- Mehrsprachige Unterstützung: Aktuell werden R und Python unterstützt, strukturell ist eine Erweiterung auf andere Sprachen möglich
- Vertraute und zugleich erweiterbare UI: Bietet eine RStudio ähnliche Struktur mit 4 Bereichen (Source, Konsole, Variablen, Plots) und zugleich die Erweiterbarkeit von VS Code
- Sprachspezifische Engines (Language Packs): Python und R laufen als unabhängige Erweiterungen, wodurch die Stabilität der IDE erhalten bleibt; bei einem Absturz steht nicht die gesamte IDE still
Ark für die R-Unterstützung
- Ark (An R Kernel): Ein neuer Jupyter-Kernel für R, der Codeausführung, Autovervollständigung, Diagnostik und Debugging bietet
- Die Unterstützung für die Tree-sitter-R-Syntax wurde neu entwickelt und kann auch für GitHub Code Search sowie in anderen IDEs (Zed, Neovim usw.) genutzt werden
- Innovation beim Debugger: Es ist möglich, direkt aus R-Code schrittweise in C++-Code hineinzugehen, was die Effizienz beim Debugging von Paketen auf Basis von Rcpp/cpp11 maximiert
Spezialisierte Funktionen für Data Science
- Data Explorer: Geht über eine einfache Tabelle hinaus und bietet zusammenfassende Statistiken, Prüfung auf fehlende Werte, Mehrfachfilterung und Histogramm-Sparklines
- Variables Pane: Ermöglicht die Untersuchung von Variablennamen, Typen, Vorschauen und die erweiterte Navigation in Dictionaries
- Plots Pane: Unterstützt das Sammeln und Vergleichen visueller Ergebnisse sowie den Export in Formaten wie PNG, SVG und PDF
- Help Pane: Durch Eingabe von
? hinter einem Funktionsnamen lassen sich Dokumentation und Beispiele sofort anzeigen; damit werden die Stärken von RStudio auch Python-Nutzern zugänglich gemacht
Technische Grundlage und Architektur
- Anders als RStudio setzt Positron nicht auf eine Single-Process-Struktur, sondern auf die mehrschichtige Architektur auf Basis von Code OSS aus VS Code
- Verwendete Standardprotokolle:
- Codeausführung → Jupyter Protocol
- Codeunterstützung (Autovervollständigung, Syntaxprüfung) → Language Server Protocol
- Debugging → Debug Adapter Protocol
- Dank dieser Standardisierung ist Interoperabilität mit verschiedenen Umgebungen wie Jupyter Notebook und Zed IDE möglich
Community und Erweiterbarkeit
- Über den Open VSX Marketplace können zahlreiche mit VS Code kompatible Erweiterungen genutzt werden (GitHub Copilot jedoch nicht)
- Funktionen lassen sich durch Erweiterungen wie Quarto, Shiny und Datenbankanbindungen ausbauen
- Dark Theme, Layout-Anpassungen und Kompatibilität mit dem RStudio-Keymap stärken die Personalisierungsmöglichkeiten
Beziehung zu RStudio
- RStudio wird weiterhin gepflegt und unterstützt und dürfte dank seiner Stabilität und Reife noch auf absehbare Zeit von vielen Nutzern eingesetzt werden
- Positron ist eine neue, experimentellere und hochgradig erweiterbare Option und zeigt langfristig einen Entwicklungspfad für Data-Science-IDEs auf
Für wen Positron geeignet ist
- VS-Code-Nutzer: wenn ihnen spezielle Funktionen für Data Science fehlen
- JupyterLab- und Notebook-Nutzer: wenn sie auf eine leistungsfähigere und vollständigere IDE erweitern möchten
- RStudio-Nutzer: wenn sie Anpassbarkeit und Erweiterbarkeit ihrer IDE ausbauen möchten
- Mehrsprachige Nutzer: wenn sie neben Python und R auch Rust, C++, JavaScript oder Lua einsetzen
- Nutzer mit Fokus auf AI-Einsatz: wenn sie AI-Integrationen wünschen, die speziell auf Data Science zugeschnitten sind
Ausblick
- Unterstützung für die Integration mit Posit Workbench und Cloud ist geplant; auch Kollaborationsfunktionen (Echtzeitfreigabe, gemeinsame Workspaces) werden untersucht
- Geplant sind verbesserte Unterstützung für große Datenmengen sowie stärkere On-Disk-Datenverarbeitung durch Integration von DuckDB und Arrow
- Dank Mehrsprachigkeit, Erweiterbarkeit und standardprotokollbasierter Architektur hat Positron gute Chancen, sich als Standard der nächsten Generation für Data-Science-IDEs zu etablieren
Noch keine Kommentare.