Hoe wij openbaar bijhouden wat een AI-project kost (en oplevert)

*Onderdeel van het 12-maanden-transparantie-experiment van Ondernemen in de Kempen. Editie 1 van een serie waarin we cijfers, methodiek en uitkomsten open delen.*

Waarom dit project openbaar gemeten wordt

Ondernemenindekempen.nl is een gratis, non-profit bedrijvengids voor de Kempen-regio. Sinds 14 april 2026 draait een volledig vernieuwde versie, gebouwd door één persoon met AI-tools als pair-programmer. Dat is geen mainstream-keuze. In online marketing leeft op dit moment het beeld dat AI-content "slecht rankt" — een hele bedrijfstak van humanizer-tools en "100% human-written"-claims bouwt op die aanname.

Wij testen openlijk het tegenovergestelde: alle inhoud expliciet als AI-gegenereerd benoemen, met volledige disclosure op /over-ai, en 12 maanden lang publiek meten wat dat doet. Drie vragen leiden het experiment:

Kwaliteit — lukt het met AI-tools een gids van hoge kwaliteit te maken: inhoudelijk correct, bruikbaar voor wie hem opent?
Traffic — vinden zoekmachines, AI-aggregators en regulier publiek deze content, of straft de disclosure ons af?
Waarde — is het uiteindelijk waardevol voor de ondernemers en de regio?

Geen van deze drie is vanzelfsprekend bij een AI-gebouwd project zonder gevestigde autoriteit, zonder gekochte links en zonder team. Dat maakt het meetbaar interessant — voor mij, en als datapunt voor collega's die met soortgelijke afwegingen zitten.

Wat we publiek tonen op /transparantie

Op de pagina /transparantie staan tellingen voor zes categorieën:

Inspanning

— geregistreerde tijd in het project, aantal prompts naar Claude, aantal antwoorden, geproduceerde tokens, en de verhouding prompts-per-uur. Tijd komt niet uit een handmatige urenstaat maar uit de event-historie van de AI-assistent. Idle-tijd (sessies die overnight open staan, of waar geen interactie meer plaatsvindt) wordt eruit gefilterd: een "burst" is een reeks prompts met onderlinge gap kleiner dan dertig minuten. Pauzes langer dan dertig minuten — slapen, lunch, ander project — tellen niet.

Code

— totaal aantal commits in de git-historie, opgesplitst naar conventional-commit-prefix (feat voor nieuwe features, fix voor bugfixes, chore voor onderhoud, enzovoort). De volledige geschiedenis is publiek na te lezen op de repository.

Wat er op de site staat

— aantal bedrijven in de gids, claims (geregistreerd, inclusief herzieningen), kennisbank-artikelen, en nieuwsberichten plus evenementen samen.

Naar buiten gestuurde communicatie

— verzonden persmails (en welk percentage daadwerkelijk gepubliceerd is), verzonden herzieningsmails (gevolgd door bevestigingen en intrekkingen), uitgegane gastpost-pitches, en individuele berichten in en uit.

Per dag

— een tabel voor de laatste veertien dagen met uren, prompts, antwoorden en commits. Zo zie je dat de inspanning niet gelijk verdeeld is over de tijd, maar in bursts gebeurt rond bepaalde features of beslismomenten.

Methode en privacy

— de eerlijkheids-disclaimer per metric en wat we expliciet níet publiceren. Daarover zo direct meer.

De privacy-grens: wat we expliciet níet tonen

Transparantie betekent niet "alles openbaar". Wat we publiceren zijn aggregaten — telling per dag of totaal. Wat we niet publiceren:

Prompt-inhoud — wat ik exact aan Claude vraag, en wat Claude exact terug zegt. Dat is werkmateriaal, vergelijkbaar met kladpapier op een bureau. Een eindredacteur publiceert ook geen Word-documenten met track-changes.
Mail-teksten en ontvanger-data — wie wat heeft gemaild, en wat erin stond. Privacy-rechten van ontvangers gaan voor.
IP-adressen en sessie-tokens van bezoekers — die slaan we sowieso niet langdurig op, en zeker niet openbaar.
Exacte tijdstippen — alleen dagen worden getoond, geen "om 14:23 zat hij te coderen". Dat dient geen doel en zou intrusief zijn.

Het script dat de cijfers verzamelt staat publiek in de repository. Iedereen kan controleren wat we meten en hoe — als de implementatie zou afwijken van wat we beweren, zou dat zichtbaar zijn in de code zelf. Dat is een sterkere garantie dan welke privacy-belofte ook.

Bronnen waar de cijfers vandaan komen

De aggregatie combineert vier bronnen:

Claude Code session-log (op de werkmachine, niet op de productieserver) — voor tijd-aggregatie. De log bevat per sessie een lijst events met timestamps; uit die events worden de bursts opgebouwd.
Claude Code conversation-logs — voor prompt-tellingen en token-bedragen. Elke regel in de log is een gebeurtenis, met daarbij ook (waar relevant) hoeveel input- en output-tokens er aan te pas zijn gekomen.
Git-historie van de repository — voor commit-tellingen. Conventional-commit-prefixes worden er met een reguliere expressie uitgehaald om de categorisatie te maken.
Productie-database via een leesvergrendelde verbinding — voor de tellers op wat er aan zichtbare inhoud staat: aantal bedrijven, kennisbank-artikelen, gegenereerde nieuws-items, uitgaande communicatie. Deze waarden zijn een snapshot op het moment van de meting.

Per dataronde wordt het resultaat opgeslagen in één JSON-bestand dat samen met de rest van de codebase wordt gepubliceerd. Bij elke aggregatie wordt dat bestand bijgewerkt en gecommit. Zo ontstaat ook een historisch dossier van hoe de cijfers veranderen.

Hoe je dit zelf voor je eigen project kunt doen

De methodiek is niet specifiek voor een bedrijvengids. Voor wie zelf een experiment-in-public wil opzetten over een AI-gebouwd project, vier praktische stappen:

Bepaal wat je vraagt, niet wat je hoopt.

Open metingen werken alleen als je vooraf duidelijk maakt welke vraag je probeert te beantwoorden. "Lukt het om met AI een gids van hoge kwaliteit te maken" is een vraag. "AI-content rankt prima" is een claim. Het verschil bepaalt of je achteraf eerlijk kunt zijn over tegenvallers.

Meet meer dan output, ook input.

Veel projecten publiceren alleen "kijk hoeveel bezoekers/abonnees/artikelen" — niet de inspanning die eraan voorafging. Een betere maat is een verhouding: hoeveel uren werk per artikel, hoeveel prompts per commit, hoeveel tokens per pagina. Dat geeft een eerlijker beeld van duurzaamheid.

Trek een privacy-grens vóór je begint, niet erna.

Bepaal direct wat aggregaat is (en publiek mag), wat persoonsgegevens zijn (en niet publiek mogen) en welke werkmateriaal (kladpapier-status, niet relevant voor het publiek). Achteraf afgrenzen is gevoeliger en vaak inconsistent.

Maak de meet-tooling open-source.

Zonder verifieerbare implementatie is een transparantie-belofte alleen een claim. Een open script is sterker. Voor wie inspiratie nodig heeft: de implementatie voor dit project staat publiek beschikbaar via GitHub.

Wat we volgende edities laten zien

Dit is editie 1, de baseline-meting (T+0) op het moment dat het transparantie-dashboard live gaat. Vier vervolgedities staan ingepland: T+30 (rond 14 juni), T+90 (begin augustus), T+180 (medio november) en T+365 (mei 2027). Per editie tonen we hetzelfde dashboard plus de delta ten opzichte van de vorige meting, en bespreken we de hypotheses die we wél en níét konden bevestigen.

Tegenvallende cijfers publiceren we ook. Als blijkt dat het AI-content-disclosure-experiment ons doet afstraffen in zoekresultaten, dan staat dat hier net zo goed. Geen retroactieve duiding om het mooier te maken dan het is.

Wat hier op het einde van de twaalf maanden uitkomt, is op dit moment werkelijk niet te voorspellen. Dat maakt het meetbaar interessant.

---

*Vragen of suggesties over de methodiek? Mail gerust naar [email protected] of gebruik de "Klopt iets niet?"-knop rechtsonder op elke pagina.*