JLABS

JLabs.Pressant.Historie

Historie prováděných úprav a komentář k Pressant


Bullet Tento text je řazen proti proudu času, nejnovější položky vpředu. Při čtení na retrospektivu nebo pro orientaci v houšti změn je nutno postupovat odzadu ... Preskripční studie je organizována po odborné stránce skupinou vedenou primářem MUDr. V.Jindrákem, úlohou JLabs je zabezpečení statistické analýzy shromážděných dat se vším všudy. Detaily obsahu studie zde nejsou zveřejňovány.

=======================================================================================================================

Hodnocení změny atb léčby:
  Zvolené kategorie nejsou nutně správné. Případ je charakterizován změnou, tedy výskytem A-čka
  v aspoň jedné návštěve, pomineme-li případy, kdy je změna vlastně zahájením pohotovostí a schváleným
  naším lékařem. Změnu ale chrakterizujeme jako změnu skupiny antibiotik. Může být, že se měnil
  konkrétní lék, pečlivý lékař to zaznamenal, ale neměnila se skupina. Podobně i u dávkovaní, kde
  se mohla změnit pouze razance léčby.

Jemnost sledování parametrů:
  V řadě případů je jemnost sledování případů až nepřiměřená. Zejména se to týká těch parametrů,
  kde se iterují všechny diagnózy proti všem skupinám atb a všem praxím. Celkem vzniká řádově
  10,000 individuálních výsledků. Jenom jejich samotné spočítání trvá dlouho. To by tak moc nevadilo,
  horší je to, že statistická vypovídací schopnost takto atomizovaných dat je velmi malá. Relevantní
  výsledky budou spíše jenom za regiony a celkově. Přihlédneme-li k tomu, že se nějaké záznamy musely
  prohlásit za vadné, pak u řady lékařů bude při malých číslech výsledků ihned vidět, že něco nesedí.
  Podobně se projeví i případná zjednodušující kriteria ve výpočtu nebo přijaté kompromisy mezi absolutní
  kvalitou dat a realizovatelností analýzy.


Postup analýzy step-by-step:

20021030-20021104
  Sestaveny scénáře pro generování reportů.
  Zavedení a výpočet tzv. jmenovatelů pro výpočty procentních parametrů.
  Astronomické množství malých úprav a verifikace výsledků.

20021029
  Příprava posledních parametrů, revize stávajících.
  Sepsána tato stránka.

20021028
  Atomizovány všechny výpočty všech parametrů.
  Pojmenovány všechny parametry.
  Každý výpočet má tedy svůj stejnojmenný skript (algoritmus) a zadavatel studie může celkem
  přímočaře kontrolovat, co se vlastně počítá.
  Všechny výpočty jsou převedeny na uniformní a banální scénář s cílem snadné kontroly
  věcné správnosti:
    
    definuje se dataset, tedy množina odpovídající zkoumanému znaku
    tento dataset obashuje záznamy (epizody nebo návštěvy), které 1:1 odpovídají kýžené množině
    dataset je mechanicky posléze rozkrájen na kousky po praxích a regionech a vzniknou parciální výsledky

20021027
  Opět intenzivní výpočty. 
  Problémy se hromadí kolem přiliš velkého počtu mezivýsledků. Rozhodnuto, že se budou skladovat
  jenom ty výsledky, které jsou nenulové.
  Podobně rozhodnuto, že procentní výsledky budou počítány jenom just-in-time. Jenom jejich
  insertování do databáze zabírá zbytečných pár minut v každém běhu ...
  Největším viníkem složitosti analýzy je fakt, že se oslovuje hned několik záznamů najednou jako
  epizoda a občas každý záznam zvlášť. Výsledky budou nutně občas ovlivněny zjednodušením. Například
  počítáním diagnóz u dlouhých epizod apod.
  Asi se měla zavést váha, cosi jako počítat diagnózy váženě vůči délce epizody. Takto totiž dlouhé
  případy vydají za pět nebo více krátkých.

20021026
  Velmi intenzivně počítány různé výsledky.
  Rozhodnutu vypočítat tabulku epizod a používat případ od případu buď tuto mezitabulku nebo haldu protokolů.
  Řada vnořených sql queries je sice syntakticky v pořádku, ale jejich počítání je neúměrně dlouhé i když
  se celá databáze nasaje do paměti a i na velmi výkonném počítači (1.8GHz a 1.5GB RAM).
  Rozhodnuto počítat průchody přes vypočítané datasety skriptem a ne přes SQL. Viníkem je velmi
  velký počet odesílaných sql queries, řádově 100,000. To je moc i pro rychlý server.
  Vzhledem k ne úplnému porozumění významu parametrů je potřeba analýzu počítat dokola x-krát a výsledky
  měřit zdravým rozumem. Rychlost je primární. Vytvořeno mnoho podružných indexů tak, že struktura indexů
  zabírá více místa než vlastní tabulky se záznamy o návštěvách.

20021025
  Provedeny detailní revize pracovních scénářů.
  Provedena řada výpočtů různých parametrů.
  Odhaleny vesměs nevýznamné chyby v datech, vyjasněn význam řady parametrů.

20021024
  Provedeny detailní revize pracovních scénářů.
  Získáno definitivní zadání pro výstupy analýzy.
  Vytvořeny první verze výstupů a výpočtů.
  Rozhodnuto oddělit fázi výpočtů od fáze sestavení výstupních sestav.
  Vyjasněny alespoň klíčové analytické skupiny co do významu.

20021008 - 20021010
  Definována databáze.
  Vytvořen generický model.
  Vytipovány kategorie chybných údajů a sestaveny kontrolní pohledy.
  Vytvořeny vhodné pracovní tabulky.

Prehistorie a Press:
  Sestavení aplikací.
  Analýza problematiky.
  Odladění.

=======================================================================================================================
Kalkulace ex-ante pro rozpočet analogické akce:
-----------------------------------------------------------------------------------------------------------------------
  Cílem této sekce je pokusit se odhadnout přímočaře náklady na podobnou akci, kdyby se měla
  realizovat na komerční bázi. Nepočítáme v to případnou odměnu pro lékaře v praxích za
  vyplnění formulářů. Odhadem by to projekt prodražilo o cca 10% navíc.

  Shromážděný datový materiál je rozsáhlý a požadované analýzy jsou velmi složité.
  Vesměs se to vymyká běžným nárokům na statistické zpracování, hlavně z těchto důvodů:

    Zkušenost s podobnými projekty je malá.
    Je to celkem unikátní akce.
    Podstata věci ja ta, že se ortogonálně sledují případy i jejich sekvence nepredikovatelné délky.
    Význam požadovaných zkoumaných parametrů je vágní a je velmi pracné je krok po kroku vyjasnit.
    Výsledky výpočtů je potřeba průběžně měřit zdravým rozumem.
    Velká diskrepance v používaném jazyce mezi odbornou mikrobiologickou částí a statistickým zpracováním.

  Měřeno rozsahem a složitostí dat se jedná o cca 1% rozsahu sčítání lidu počtem záznamů a přibližně o
  3 nebo 4% při započítání faktu, že zkoumaná data jsou mnohem složitější jak strukturou i vazbami než
  údaje o počtu lidí v domácnostech, pračkách apod.

  Závěr: 
    Rozpočet by se měl pohybovat někde v okolí alespoň 1% rozpočtu na sčítání lidu, přinejmenším
    pro několik prvních auditů podobného ražení. Jinak je celý projekt někde postaven na dobrovolnické
    práci nebo nákladech hrazených skrytě.
    Přistoupíme-li na to, že státem organizované sčítání lidu je přece jenom veleakce zatížená
    ohromnými nadbytečnými náklady (propaganda kolem, výstavba budovy, koupení počítačů a celé sítě)
    i neefektivností, pak jako minimální traktabilní rozpočet ex-ante na podobnou akci je někde v okolí
    5,000,000. Toto číslo je stanoveno mechanicky podle rozsahu a složitosti akce, níže se pokusíme
    popsat náklady položkově.


=======================================================================================================================
Adresné náklady - odhady
-----------------------------------------------------------------------------------------------------------------------
 
Odhadovaná specifická pracnost v analýze a implementaci:
  Press a celá akce s jeho rozjetím
  Pressant
  Balastní čas za atomizaci a nevyhnutelné iterace
  Samotné výpočty, ladění výstupních parametrů a sestav
  Odhadem 300h á 1,500.- a tedy cca 450,000
Skryté náklady na straně mikrobiologů
  Odborná definice studie - mikrobiologové
  Odborná analýza výsledků - mikrobiologové
  Průběžné byrokratické zabezpečení
  Know-how odhadem 2,000,000 - započteno 20% s ohledem na fyzickou možnost realizace podobných projektů v čase
  Odhadem 800,000
Náklady na zpracování dat
  Náklady na zpracování dat včetně amortizace počítačů software atd.
    cca 16 na jeden záznam, tedy cca 800,000
Statistické zpracování:
  Vybavení výpočetní technikou, alespoň 2ks server a 4ks stanice
  Vhodný software
  Vhodný a výkonný databázový systém
  Vývojové prostředí
  Standardní software
  Internetová konektivita
  Amortizace licencí všemožného software
  Administrátor systému
  Know-how
  Odhadem 4,000,000 jako nezbytné minimum - započteno 20% s ohledem na další využívání vybavení
  Tedy 800,000
Základní náklady celkem:
  2,850,000
Celková kalkulace:
  Financování 12 měsíců předem - 12%
  Organizační režie - 10%
  Zisk 15%
  Prezentace výsledků, semináře, ... 10%
  cca 4,200,000

Poznámka:
  Tato kalkulace předpokládá, že se bude realizovat alespoň 5 podobných akcí, do kterých se
  rozloží jednorázové náklady a náklady na znalost věci. Procentní navýšení v Celkových kalkulacích
  se počítá sumárně a ne kumulativně. Při komerční organizaci podobné studie je možno počítat
  tedy okrouhle s 10% ziskem v průběhu 12 měsíců celkem riskantní akce, která je velmi náročná
  na pracnost a iniciální investice.


Bullet Index


JLABS Aktualizováno dne 20010129. Komentář: info@jlabs.cz