🦀 Sir Catch-a-lot — Arbeids-oversikt for modellen
Intern arbeidsside (ikke for publikum) · viser hvordan AI-en bygges, hva vi har, og hvor vi trenger hjelp · oppdatert 2026-06-12
Denne siden finnes kun mens vi jobber med å gjøre modellen bedre. Den lar Morten + Knut «se» hvordan modellen tenker,
hvilke data vi har, og hvor dere best kan hjelpe (særlig: ekte fangst-/tom-teine-data i nye områder). Tallene er ærlige — ingen pynt.
1 · Regionene vi jobber med
Norge er delt i 9 områder. Bare Færder har en validert AI i appen nå. Skagerrak er nest på tur (god nok). Resten venter på data.
| Region | Status | Ærlig AI-kvalitet | Dyp (m) | Kommentar |
| FaerderSKAGERRAK | validated | 0.86 VALIDERT | 5–26 | Egen modell, spatial-block-CV 0.855. AI modell trent fra Knut-data. Live i appen. |
| Skagerrak/OslofjordSKAGERRAK | planned | 0.72 KLAR (preview) | 3–50 | Nasjonal TGB-LORO 0.72 — god nok til region 2. Mangler deployet scorer. |
| Soervest (Lindesnes-Stad)SORVEST | planned | 0.60 svak | 3–50 | TGB-LORO ~0.60. Trenger in-region teine-labels. |
| Vestland-fjorderVESTLAND_FJORD | planned | 0.60 svak | 3–50 | TGB-LORO ~0.60. Fjordarmer dårlig oppløst på 800 m; ferskvann avgjør. |
| NordlandNORDLAND | planned | 0.58 svak | 3–50 | TGB-LORO ~0.58. |
| MoereMORE | planned | 0.53 svak | 3–50 | TGB-LORO ~0.53. Arter deler habitat — svakt skille uten ekte labels. |
| Troendelag/HelgelandTRONDELAG_HELG | planned | 0.53 svak | 3–50 | TGB-LORO ~0.53. KJERNEOMRÅDE (75% av fangst) men tynt hobby-presence. |
| TromsTROMS | planned | 0.42 kun transfer | 3–50 | Range-edge, lav tetthet. Ingen in-region validering. |
| FinnmarkFINNMARK | planned | 0.38 kun transfer | 3–50 | Kald marginal, 5 presence-funn. Ingen validering. |
«Ærlig AI-kvalitet» = held-out-treffsikkerhet (0.5 = gjetting, 1.0 = perfekt). Færder måles på egen fasit; resten på nasjonal kryss-region-test.
2 · Hva AI-en ser på (kriteriene)
Modellen rangerer habitat-egnethet (god krabbe-plass), ikke hvor mye du får. Den lærte disse av Knuts fasit + nasjonale data:
✅ Brukes (gir signal)
- Dyp — krabbe-optimum, grunt om sommeren (5–25 m), dypere vinter. Bærende.
- Ruhet i bunnen — ruglete/variert bunn = skjul/hardbunn. Sterkeste enkeltfaktor (Færder).
- BPI (forsenkning/topp) — skåler/groper vs koller.
- Avstand til land — Knuts plasser ligger nær land. (NB: svakt nasjonalt pga. citizen-bias, se §6.)
- Bunntemperatur (NorKyst) — varierer mellom regioner, løfter nasjonal modell (RF).
- Bunnsalt (NorKyst) — lite salt = elveutløp/innerst i fjord = krabbe misliker det.
- Eksponering/fetch — hvor åpent/skjermet mot vind og bølger.
- Oksygen-flate — terskelfjord med lavt oksygen = gjørmehull = no-crab (egen «dårlig»-kilde).
❌ Testet og forkastet (0 verdi)
- Bunntype/substrat-kart (EUSeaMap) — ga ingen prediktiv verdi (0.50). Droppet.
- NGU-sedimentkart — for dårlig dekning (3/20).
- Havstrøm (NorKyst) — netto null på Færder. Ikke verdt avhengigheten.
- Copernicus 7 km — for grovt, land-maskerer fjorden.
Disiplin: et lag må bevise at det forbedrer den ærlige treffsikkerheten før det tas inn. Ellers ut.
3 · Forbudssoner (hvor du IKKE kan sette teine)
Hentet nasjonalt fra Fiskeridirektoratet: hummerfredning, nullfiske-områder, korallrev. Dette er regel-laget — appen viser sonene, modellen rører dem ikke. Eksakt teine-regel per sone må Knut/forskrift bekrefte.
| Region | Forbuds-/restriksjonssoner | Gjørmehull (lavoksygen) |
| Faerder | 13 | 0 |
| Skagerrak/Oslofjord | 33 | 18 |
| Soervest (Lindesnes-Stad) | 47 | 153 |
| Vestland-fjorder | 32 | 113 |
| Moere | 2 | 69 |
| Troendelag/Helgeland | 3 | 524 |
| Nordland | 3 | 362 |
| Troms | 1 | 55 |
| Finnmark | 1 | 117 |
Nasjonalt totalt: 78 hummerfredningsområder · 19 korallrev-soner · Oslofjord nullfiske. Per-region filer: data/zones_<region>.geojson
4 · Hvordan vi VERIFISERER modellen (at den ikke jukser)
Tester vi kjører
- Romlig blokk-kryssvalidering — hold ut et område, sjekk om modellen treffer der. (Hindrer at den «pugger».)
- Leave-one-region-out (LORO) — tren på alle regioner unntatt én, test på den. = «virker den i et nytt område?»
- Gjørme-test — havner kjente dårlige plasser (lavoksygen) nederst? (Færder: 0.996 ✓)
- Knuts GOOD/BAD-fasit — skiller modellen Knuts gode fra dårlige? (Sterkeste sanne test vi har.)
- Target-group-test — sammenlign mot hvor ANDRE kyst-krabber sees, så «nær land»-jukset fjernes.
Ekstern data vi måler mot
- DATRAS (46k tråltrekk, samme art, ekte nuller) — metodebevis.
- SEANOE CGFS (3 179) + NEFSC (slektning, 43k) — transfer-bevis.
- GBIF/OBIS uavhengige funn — holdout-presence.
- Maskinregel (
check_consistency.py): en region får status «validert» kun hvis ekte blokk-test ≥ 0.75 OG ≥ 40 labels. Aldri juks.
5 · All god data vi har lagret (og hvor)
| Fil / plassering | Hva | Brukes til | Str. |
data/external/fiskeridir_krabbe_NO.geojson | 458 teine-polygoner (Fiskeridir, hele kysten) | presence-prior + target-group | 4.4 MB |
data/external/gbif_cancer_pagurus_NO.json | 1282 GBIF taskekrabbe-funn | presence (citizen) | 178 KB |
data/external/obis_cancer_pagurus_NO.json | 1942 OBIS-funn (kun sør) | presence | 165 KB |
data/external/gbif_tgb_NO.json | 3144 strand-/pyntekrabbe | target-group-bakgrunn (fjerner kyst-bias) | 338 KB |
data/external/naturbase_lavoksygen_NO.geojson | 126 terskelfjord-basseng (lavt oksygen) | no-crab absence (gjørmehull) | 1.3 MB |
data/expert_points.jsonl | 57 Knut-plasser + no-crab | FASIT — beste in-region labels | 14 KB |
data/ground_truth.json | Operatør GOOD/BAD + 6-rangering | lokal validering Færder | 6 KB |
data/train_matrix2.npz | Trenings-matrise (features) | live v6-modell (Færder) | 87 KB |
data/norkyst_*.npz / norkyst_grid.npz | NorKyst bunntemp+bunnsalt per region | miljø-features | — |
data/absence_*.geojson · zones_*.geojson · speed_*.geojson | Per-region absence / forbudssoner / 5-knop | modell + app-lag | — |
data/national_loro_SUMMARY.json | Ærlig nasjonal LORO-evidens | modell-status per region | 0 KB |
Alt ligger lokalt på arbeids-PC-en under ~/Documents/krabber/. Henteskript: tools/fetch_*.py, tools/build_*.py (reproduserbare).
6 · Norges-kart — hvor AI-en er god (grønt) vs usikker (rødt)
God / validert (Færder, Skagerrak)
Svak — trenger data
Kun transfer / ingen validering
Krabbe-funn
Gjørmehull (lavoksygen)
▦ Fiskeri teine-felt
Bruk avkrysningene oppe til høyre i kartet for å vise/skjule krabbe-funn, gjørmehull og teine-felt. Klikk en region for detaljer.
Merk: nord har kun GBIF-funn (OBIS slutter ved 61°N) → tynnere datagrunnlag.
7 · Hva vi har gjort (kort, for Knut og andre)
- Færder-modellen (live): lært av Knuts 57 plasser + operatørens fasit. Skiller gode plasser fra gjørmehull (ærlig blokk-test 0.855, gjørme 0.996). Kjører på appen nå.
- Gått nasjonalt: hentet åpne data for HELE Norge — 458 fiskeri-teinefelt, 1282 GBIF + 1942 OBIS krabbe-funn, 126 lavoksygen-fjorder, bunntemp/salt, forbudssoner, 5-knop-soner. Alt region-organisert.
- Bygget en nasjonal test-modell og målte ærlig hvor godt den virker i nye områder.
- Viktig oppdagelse: krabbe-funn fra folk flest ligger «på stranda» → modellen kan jukse med «nær land = krabbe». Vi korrigerte det (target-group-test) → da så vi det sanne bildet: ~0.61 nasjonalt, men Skagerrak 0.72 (god nok!), nord/vest svakere.
- Konklusjon: flere datalag løser det ikke alene — det vi virkelig trenger er ekte fangst-data (og tomme teiner!) fra nye områder.
8 · Slik kan DERE hjelpe meg å bli bedre 🙏
- Tomme teiner er gull. «Så bra ut, men ingen krabbe» = de hardeste, mest verdifulle dataene. Marker dem i appen (rød knapp).
- Spre plassene. Knuts data klynger i nord/øst i Færder — labels i sørvest utvider modellen mest.
- Ny region = ny «Knut». Vil vi ha AI i Trøndelag/Vestland, trengs en lokal ekspert som markerer 15–40 gode + dårlige plasser.
- Dyp 30–50 m (vinter) — hobby-data er grunn-skjevt; dypere plasser mangler.
9 · Hva vi jobber med videre (todo)
| # | Fase | Oppgave | Status |
| 1–7 | FASE 1 | Nasjonal data-ingest (alle kilder + region-arkitektur) | ✅ Ferdig |
| 8 | FASE 2 | NorKyst-features + nasjonal LORO-måling | ✅ Ferdig |
| 9 | FASE 2 | Target-group-test + maskinregel mot overfit | ✅ Ferdig |
| 10 | FASE 3 | Aktiver Skagerrak som region 2 (deploy scorer + preview-badge) | 🔜 Neste |
| — | FASE 3 | Sjø-navigering (A*) + cluster-kjøreplan i appen | ⏳ Planlagt |
| — | FASE 4 | PWA / offline kart-cache / installer | ⏳ Planlagt |
| — | Data | In-region teine-labels i svake regioner (Knut/operatør) | 🙏 Trenger dere |
Generert av tools/build_workflow_page.py · ærlige tall fra data/national_loro_SUMMARY.json + regions/registry.json