Ich beschäftige mich beruflich mit Content Managment Systemen (CMS) - für das Druck- und Verlagswesen.
D.h. große Verlage nutzen diese Systeme um ihre Dokumente zu verwalten und eine Änderungsverfolgung zu haben, bevor die Dokumente gedruckt werden.
In diesem Umfeld wird mit großen Dateien, oft 100 MB gearbeitet.
Bei solchen Größen macht eine reine Datenbanklösung keinen Sinn, hier wird ein Hybridsystem genutzt, d.h. die eigentliche Dokumente liegen in einer Ordnerstruktur im Filesystem (dort werden dann auch ältere Versionen vorgehalten).
Die Metadaten die zu einem solchen Dokument liegen dann in der Datenbank - sodass eine Suche oder das Ändern von Daten blitzschnell geht.
Bei den EML Dateien, um die es sich ja letztlich bei David handelt, sind die Metadaten ja bereits Bestandteil des Inhalts. Insofern ist der Weg den David geht nachvollziehbar.
Inzwischen nutzen die ja auch so ein Hybridsystem, und in der Datenbank werden die Metadaten redundant abgelegt und für die Suche indiziert.
Grundsätzlich erhöht eine Datenbank den Administrationsaufwand und es sind mehr Ressourcen nötig um eine Datenbank performant betreiben zu können, in der heutigen Zeit spielt so etwas allerdings nur noch eine untergeordnete Rolle.
Aus meiner Sicht, könnte man bei David nur eine Sache anders machen, nämlich die einzelnen E-Mails ebenfalls in der Datenbank speichern und nur die Attachments im Filesystem lassen, in diesem Fall müsste man dann quasi vom EML weg - hin zu einem eigenen Format, aber dann hat man wieder Aufwand wenn man aus David als EML exportieren möchte.