Wie bereits beschrieben, hängt der Energieverbrauch von der Größe des URL-Verzeichnisses, der Häufigkeit der URL-Prüfung sowie der Intensität der Suche nach neuen URLs ab. Auch wenn sich die URL-Discovery für KI-basierte Suchmaschinen technisch nicht von der URL-Discovery für Index-basierte Suchmaschinen unterscheidet, ist ein anderes Prüfungsintervall beziehungsweise ein anderer Prüfungsumfang sinnvoll. Das liegt daran, dass die URL-Discovery nur einmalig für das Grundtraining und quartalsweise für das Aktualisierungstraining durchgeführt wird.
Für den Energieverbrauch der URL-Discovery für das Grundtraining ist zu berücksichtigen, dass nicht alle verfügbaren Seiten gefunden werden müssen, sondern eine deutlich geringere Datenmenge ausreichend ist. Wie der Abschnitt „Energie-Crawling“ zeigt, wird für das Grundtraining ein Datensatz von ungefähr 1151,7 Millionen Webseiten benötigt. Wie in Abs. „Energie-URL-Discovery“ gezeigt wurde, kann ein CPU-Kern ca. 1,8 Millionen URLs pro Tag prüfen.
Bei einem Energieverbrauch eines CPU-Kerns von 354 Wh pro Tag ergibt sich bei einer Rechendauer von 634,8 Tagen sowie eines PUE von 1,10 ein Energieverbrauch 247,2 kWh.
Bei einer Verfügbarkeitsprüfung muss für jede URL der DNS durchsucht, eine Verbindung zum Host aufgebaut, eine Request gesendet und die Antwort empfangen werden. Dabei verursacht nicht nur der Server einen Energieverbrauch, sondern auch der Datentransfer im Internet. Beim Versenden der Requests wird vermutlich ein möglichst kleiner Header genutzt, um die Datenrate möglichst gering zu halten. Jedoch kann eine Antwort mit Inhalten im Body schnell mehrere kB groß sein.
Die durchschnittliche Internetnutzung benötigt 0.81 kWh/GB (0.00081 Wh/kB). Dabei macht der Datentransfer durch das Internet 14% und die Antwort des Servers 15% des anteiligen Energieverbrauchs aus.
Da für die URL-Prüfung nur das HTML-Dokument und keine weiteren externen Ressourcen geladen werden müssen, ist dessen Größe für die Berechnung des Energieverbrauchs ausschlaggebend. Die HTML-Dokumente, welche über das Internet geladen werden, waren im Jahr 2022 durchschnittlich 29.4 kB groß.
Geht man nun von einem Energieverbrauch von 0,0003402 Wh/kB und einem durchschnittlichen Datenverkehr von 29,4 kB pro URL-Prüfung aus, verbraucht diese ca. 0,01 Wh. Bei einem Verbrauch von 0,01 Wh pro geprüfte URL ergibt sich für 1151,7 Millionen Webseiten ein Energieverbrauch von 11,5 MWh durch den Datentransfer.
Zusammengerechnet ergibt sich daraus ein Energieverbrauch von 11,7 MWh bei der URL-Discovery für das Grundtraining.