Die RAG-Seiten zuvor — Bewertung, Re-Ranking, agentisch, Graph — waren bewusst plattformunabhängig, weil die Prinzipien überall gelten. Diese hier ist anders: Es geht um den konkreten Aufbau auf einer Unternehmensplattform. Und der Grund, warum ein Mittelständler, der ohnehin auf Microsoft sitzt, zu Azure greift, ist kein magischer Funktionsvorsprung. Es ist, dass das Ganze in der eigenen Cloud bleibt — unter eigener Identität, eigenem Netzwerk, eigener Governance.
Ich arbeite primär auf Azure und kenne die Bausteine aus der Praxis. Diese Seite zeigt ehrlich, was die Plattform dir abnimmt — und was sie eben nicht tut, auch wenn der Verkaufsprospekt anderes nahelegt.
Warum der Mittelstand auf Azure dafür greift
Der Treiber ist selten die Technik, sondern die Umgebung. Wer schon auf Microsoft sitzt, hat seine Identitäten, sein Netzwerk, seine Zugriffsregeln und seine Compliance dort. Ein RAG in derselben Cloud zu bauen heißt: Die Firmendaten bleiben in der eigenen Umgebung, die Zugriffe laufen über die bestehende Identität, und die Governance, die ohnehin gilt, gilt auch hier.
Das ist Datenhoheit, aber innerhalb der eigenen Cloud statt vollständig auf eigenen Servern — ein anderer Punkt auf derselben Skala wie das Selbsthosten. Für sensible Daten in regulierten Umgebungen ist genau das oft der entscheidende Grund: nicht „besser”, sondern „bleibt, wo es hingehört”.
Was die Plattform dir abnimmt
Der praktische Gewinn sind verwaltete Bausteine. Für das Retrieval gibt es einen Suchdienst, der Vektorsuche und Stichwortsuche kombiniert — also die hybride Suche fertig mitbringt — und ein eingebautes semantisches Nachsortieren, das genau das tut, was die Re-Ranking-Seite beschreibt, nur als Funktion statt als Eigenbau. Du musst keine Vektordatenbank von Hand aufsetzen.
Daneben steht die Bau- und Bereitstellungsschicht: Modelle bereitstellen, die Anwendung orchestrieren, Bewertungswerkzeuge nutzen — alles innerhalb derselben Umgebung. Das spart dir einen guten Teil der Klempnerei, die du sonst selbst zusammenstecken müsstest. Weniger Infrastruktur-Handarbeit, mehr fertige Teile.
Was sie dir nicht abnimmt
Hier ist die ehrliche Stelle, die im Prospekt fehlt. Die verwalteten Bausteine machen die schweren Teile nicht verschwinden. Dein Chunking ist weiter deine Aufgabe. Die Trefferqualität ist weiter deine Aufgabe. Der goldene Prüfsatz, an dem du misst, ob das RAG nicht lügt, ist weiter deine Aufgabe. Und die Überwachung gegen Drift sowieso.
Ein verwalteter Dienst macht ein schlechtes RAG nicht gut. Die Plattform liefert dir das semantische Nachsortieren als Knopf — aber ob deine erste Suche überhaupt trifft, ob deine Inhalte sauber sind, ob die Antworten belegt bleiben, entscheidet weiter dein Urteil. Die Plattform gibt dir Werkzeuge, nicht Urteilsvermögen.
Wie ich das angehe
Schon auf Azure, sensible Daten, Governance-Anforderungen? Dann gehört das RAG in dieselbe Cloud. Ohne solchen Grund ist die Plattformwahl nicht entschieden.
Chunking und Embedding — die Werte landen im Suchdienst. Das Chunking bleibt deine Verantwortung, nicht die der Plattform.
Stichwort und Bedeutung kombiniert, mit dem eingebauten semantischen Nachsortieren. Re-Ranking als Funktion statt als Eigenbau.
Mit Quellenangabe, und alles innerhalb deiner eigenen Cloud-Umgebung. Die Daten verlassen sie nicht.
Dein Prüfsatz und deine Drift-Signale, mit den Werkzeugen der Plattform, in deiner Governance. Die Messung bleibt deine, das Werkzeug ist ihres.
Wo es kippt
Verwaltet heißt nicht gut. Der größte Trugschluss. Die Plattform nimmt dir Infrastruktur ab, nicht das Denken. Chunking, Trefferqualität und Bewertung entscheiden weiter, und die liegen bei dir.
Kosten laufen davon. Verwaltete Dienste haben ihre eigene Abrechnung — Such-Stufe, Modellnutzung, Speicher. Überdimensioniert ist schnell teuer. Bewusst auf deinen Bedarf zuschneiden.
Bindung. Tief auf die spezifischen Dienste einer Plattform zu bauen, bindet dich an sie. Das ist ein legitimer Tausch — Integrationskomfort gegen Wechselbarkeit —, aber ein bewusster, kein versehentlicher.
Die Plattform aus Prestige wählen. „Enterprise” ist kein Grund. Der Grund ist, dass du schon dort bist oder die Governance es verlangt. Sonst entscheidest du nach Etikett.
Was es kostet — und woran
Die Kosten sind die der verwalteten Dienste: die Stufe des Suchdienstes, die Modellnutzung, der Speicher. Das ist bequem und hat seinen Preis, und überprovisioniert wird es schnell teuer. Der Wert, den du dafür bekommst, ist Datenhoheit in der eigenen Cloud plus weniger Eigenbau — nicht null Arbeit.
Rechtfertigen tust du das über den Treiber: Du bist schon auf Azure, oder die Daten müssen in deiner Umgebung bleiben. Wer dir Azure-RAG verkauft, weil es „die Profi-Lösung” sei, ohne nach diesem Treiber zu fragen, verkauft dir ein Etikett. Und wer behauptet, die Plattform erledige Chunking und Qualität für dich, hat die schweren Teile verschwiegen.
Wo die Entscheidung dranbleibt
Nicht nach Prestige wählen. Die Plattform folgt dem Treiber, nicht dem Etikett.
Bewertung und Tor bleiben. Der Prüfsatz, die Belegpflicht, das menschliche Tor für Verbindliches — all das gilt auf einer Unternehmensplattform genauso. Verwaltet heißt nicht vertrauenswürdig ohne Messung.
Die Plattform hält dein RAG in der eigenen Cloud und nimmt dir Klempnerei ab. Chunking, Qualität, Bewertung und Verantwortung bleiben deine.
Wie ein ehrlicher Einstieg aussieht
Bist du schon auf Azure und sollen die Daten dort bleiben, prototype auf einem abgegrenzten Dokumentenbestand: der Suchdienst mit hybrider Suche und semantischem Nachsortieren, ein bereitgestelltes Modell, dein goldener Prüfsatz. Miss Trefferquote und Treue — innerhalb deiner Umgebung. Der Gewinn, den du belegst, ist nicht „es ist schlauer”, sondern „es hat unsere Cloud nie verlassen, und es ist nachweislich gut”. Gibt es keinen Cloud- oder Governance-Treiber, ist die Plattformfrage noch offen.
Worauf du achtest, wenn dir das jemand baut
- Gibt es einen echten Treiber — schon auf Azure, Datenhoheit, Governance —, oder ist es eine Prestige-Wahl? Letzteres ist das Warnsignal.
- Werden Chunking und Bewertung als deine Aufgabe behandelt, oder als etwas, das die Plattform angeblich erledigt?
- Sind die Kosten zugeschnitten, statt großzügig überprovisioniert?
- Wird die Bindung an die Plattform offen benannt und bewusst abgewogen?
- Stehen Prüfsatz und Überwachung, auch auf der verwalteten Plattform?
Bevor du dich auf eine Plattform festlegst, kläre den Treiber und was deine Arbeit bleibt. Diese Liste trennt das Etikett vom Grund:
RAG auf Azure — passt es, und was bleibt deine Arbeit?
1. TREIBER: Bist du schon auf Azure und/oder müssen die Daten aus Governance-/Datenschutzgründen in
deiner eigenen Cloud bleiben? -> guter Grund. NUR weil "Enterprise" draufsteht -> kein Grund.
2. WAS DIE PLATTFORM GIBT: verwaltete Bausteine — ein Suchdienst fürs Retrieval (hybrid aus Stichwort+
Bedeutung, eingebautes semantisches Nachsortieren) und eine Schicht zum Bereitstellen und Bewerten
von Modellen. Weniger Klempnerei.
3. WAS DEINE ARBEIT BLEIBT: Chunking, Trefferqualität, dein goldener Prüfsatz, die Überwachung.
Ein verwalteter Dienst macht ein schlechtes RAG nicht gut.
4. KOSTEN: Such-Stufe, Modellnutzung, Speicher — leicht überdimensioniert. Auf den Bedarf zuschneiden.
5. BINDUNG: Tiefe Nutzung bindet an die Plattform. Bewusst abwägen, nicht aus Versehen.
Ihr seid schon auf Azure und wollt euer Firmenwissen durchsuchbar machen, ohne dass Daten die eigene Cloud verlassen? Dann reden wir über euren Treiber und einen ehrlichen ersten Aufbau — und darüber, welche Teile die Plattform abnimmt und welche eure Arbeit bleiben.