JLABS

JLabs.Pressant.Historie

Historie prováděných úprav a komentář k Pressant


Bullet Tento text je řazen proti proudu času, nejnovější položky vpředu. Při čtení na retrospektivu nebo pro orientaci v houšti změn je nutno postupovat odzadu ... Preskripční studie je organizována po odborné stránce skupinou vedenou primářem MUDr. V.Jindrákem, úlohou JLabs je zabezpečení statistické analýzy shromážděných dat se vším všudy. Detaily obsahu studie zde nejsou zveřejňovány.

=======================================================================================================================

Hodnocení změny atb léčby:
    Zvolené kategorie nejsou nutně správné. Případ je charakterizován změnou, tedy výskytem A-čka
    v aspoň jedné návštěve, pomineme-li případy, kdy je změna vlastně zahájením pohotovostí a schváleným
    naším lékařem. Změnu ale chrakterizujeme jako změnu skupiny antibiotik. Může být, že se měnil
    konkrétní lék, pečlivý lékař to zaznamenal, ale neměnila se skupina. Podobně i u dávkovaní, kde
    se mohla změnit pouze razance léčby.

Jemnost sledování parametrů:
    V řadě případů je jemnost sledování případů až nepřiměřená. Zejména se to týká těch parametrů,
    kde se iterují všechny diagnózy proti všem skupinám atb a všem praxím. Celkem vzniká řádově
    10,000 individuálních výsledků. Jenom jejich samotné spočítání trvá dlouho. To by tak moc nevadilo,
    horší je to, že statistická vypovídací schopnost takto atomizovaných dat je velmi malá. Relevantní
    výsledky budou spíše jenom za regiony a celkově. Přihlédneme-li k tomu, že se nějaké záznamy musely
    prohlásit za vadné, pak u řady lékařů bude při malých číslech výsledků ihned vidět, že něco nesedí.
    Podobně se projeví i případná zjednodušující kriteria ve výpočtu nebo přijaté kompromisy mezi absolutní
    kvalitou dat a realizovatelností analýzy.


Postup analýzy step-by-step:

20021030-20021104
    Sestaveny scénáře pro generování reportů.
    Zavedení a výpočet tzv. jmenovatelů pro výpočty procentních parametrů.
    Astronomické množství malých úprav a verifikace výsledků.

20021029
    Příprava posledních parametrů, revize stávajících.
    Sepsána tato stránka.

20021028
    Atomizovány všechny výpočty všech parametrů.
    Pojmenovány všechny parametry.
    Každý výpočet má tedy svůj stejnojmenný skript (algoritmus) a zadavatel studie může celkem
    přímočaře kontrolovat, co se vlastně počítá.
    Všechny výpočty jsou převedeny na uniformní a banální scénář s cílem snadné kontroly
    věcné správnosti:
        
        definuje se dataset, tedy množina odpovídající zkoumanému znaku
        tento dataset obashuje záznamy (epizody nebo návštěvy), které 1:1 odpovídají kýžené množině
        dataset je mechanicky posléze rozkrájen na kousky po praxích a regionech a vzniknou parciální výsledky

20021027
    Opět intenzivní výpočty. 
    Problémy se hromadí kolem přiliš velkého počtu mezivýsledků. Rozhodnuto, že se budou skladovat
    jenom ty výsledky, které jsou nenulové.
    Podobně rozhodnuto, že procentní výsledky budou počítány jenom just-in-time. Jenom jejich
    insertování do databáze zabírá zbytečných pár minut v každém běhu ...
    Největším viníkem složitosti analýzy je fakt, že se oslovuje hned několik záznamů najednou jako
    epizoda a občas každý záznam zvlášť. Výsledky budou nutně občas ovlivněny zjednodušením. Například
    počítáním diagnóz u dlouhých epizod apod.
    Asi se měla zavést váha, cosi jako počítat diagnózy váženě vůči délce epizody. Takto totiž dlouhé
    případy vydají za pět nebo více krátkých.

20021026
    Velmi intenzivně počítány různé výsledky.
    Rozhodnutu vypočítat tabulku epizod a používat případ od případu buď tuto mezitabulku nebo haldu protokolů.
    Řada vnořených sql queries je sice syntakticky v pořádku, ale jejich počítání je neúměrně dlouhé i když
    se celá databáze nasaje do paměti a i na velmi výkonném počítači (1.8GHz a 1.5GB RAM).
    Rozhodnuto počítat průchody přes vypočítané datasety skriptem a ne přes SQL. Viníkem je velmi
    velký počet odesílaných sql queries, řádově 100,000. To je moc i pro rychlý server.
    Vzhledem k ne úplnému porozumění významu parametrů je potřeba analýzu počítat dokola x-krát a výsledky
    měřit zdravým rozumem. Rychlost je primární. Vytvořeno mnoho podružných indexů tak, že struktura indexů
    zabírá více místa než vlastní tabulky se záznamy o návštěvách.

20021025
    Provedeny detailní revize pracovních scénářů.
    Provedena řada výpočtů různých parametrů.
    Odhaleny vesměs nevýznamné chyby v datech, vyjasněn význam řady parametrů.

20021024
    Provedeny detailní revize pracovních scénářů.
    Získáno definitivní zadání pro výstupy analýzy.
    Vytvořeny první verze výstupů a výpočtů.
    Rozhodnuto oddělit fázi výpočtů od fáze sestavení výstupních sestav.
    Vyjasněny alespoň klíčové analytické skupiny co do významu.

20021008 - 20021010
    Definována databáze.
    Vytvořen generický model.
    Vytipovány kategorie chybných údajů a sestaveny kontrolní pohledy.
    Vytvořeny vhodné pracovní tabulky.

Prehistorie a Press:
    Sestavení aplikací.
    Analýza problematiky.
    Odladění.

=======================================================================================================================
Kalkulace ex-ante pro rozpočet analogické akce:
-----------------------------------------------------------------------------------------------------------------------
    Cílem této sekce je pokusit se odhadnout přímočaře náklady na podobnou akci, kdyby se měla
    realizovat na komerční bázi. Nepočítáme v to případnou odměnu pro lékaře v praxích za
    vyplnění formulářů. Odhadem by to projekt prodražilo o cca 10% navíc.

    Shromážděný datový materiál je rozsáhlý a požadované analýzy jsou velmi složité.
    Vesměs se to vymyká běžným nárokům na statistické zpracování, hlavně z těchto důvodů:

        Zkušenost s podobnými projekty je malá.
        Je to celkem unikátní akce.
        Podstata věci ja ta, že se ortogonálně sledují případy i jejich sekvence nepredikovatelné délky.
        Význam požadovaných zkoumaných parametrů je vágní a je velmi pracné je krok po kroku vyjasnit.
        Výsledky výpočtů je potřeba průběžně měřit zdravým rozumem.
        Velká diskrepance v používaném jazyce mezi odbornou mikrobiologickou částí a statistickým zpracováním.

    Měřeno rozsahem a složitostí dat se jedná o cca 1% rozsahu sčítání lidu počtem záznamů a přibližně o
    3 nebo 4% při započítání faktu, že zkoumaná data jsou mnohem složitější jak strukturou i vazbami než
    údaje o počtu lidí v domácnostech, pračkách apod.

    Závěr: 
        Rozpočet by se měl pohybovat někde v okolí alespoň 1% rozpočtu na sčítání lidu, přinejmenším
        pro několik prvních auditů podobného ražení. Jinak je celý projekt někde postaven na dobrovolnické
        práci nebo nákladech hrazených skrytě.
        Přistoupíme-li na to, že státem organizované sčítání lidu je přece jenom veleakce zatížená
        ohromnými nadbytečnými náklady (propaganda kolem, výstavba budovy, koupení počítačů a celé sítě)
        i neefektivností, pak jako minimální traktabilní rozpočet ex-ante na podobnou akci je někde v okolí
        5,000,000. Toto číslo je stanoveno mechanicky podle rozsahu a složitosti akce, níže se pokusíme
        popsat náklady položkově.


=======================================================================================================================
Adresné náklady - odhady
-----------------------------------------------------------------------------------------------------------------------
 
Odhadovaná specifická pracnost v analýze a implementaci:
    Press a celá akce s jeho rozjetím
    Pressant
    Balastní čas za atomizaci a nevyhnutelné iterace
    Samotné výpočty, ladění výstupních parametrů a sestav
    Odhadem 300h á 1,500.- a tedy cca 450,000
Skryté náklady na straně mikrobiologů
    Odborná definice studie - mikrobiologové
    Odborná analýza výsledků - mikrobiologové
    Průběžné byrokratické zabezpečení
    Know-how odhadem 2,000,000 - započteno 20% s ohledem na fyzickou možnost realizace podobných projektů v čase
    Odhadem 800,000
Náklady na zpracování dat
    Náklady na zpracování dat včetně amortizace počítačů software atd.
        cca 16 na jeden záznam, tedy cca 800,000
Statistické zpracování:
    Vybavení výpočetní technikou, alespoň 2ks server a 4ks stanice
    Vhodný software
    Vhodný a výkonný databázový systém
    Vývojové prostředí
    Standardní software
    Internetová konektivita
    Amortizace licencí všemožného software
    Administrátor systému
    Know-how
    Odhadem 4,000,000 jako nezbytné minimum - započteno 20% s ohledem na další využívání vybavení
    Tedy 800,000
Základní náklady celkem:
    2,850,000
Celková kalkulace:
    Financování 12 měsíců předem - 12%
    Organizační režie - 10%
    Zisk 15%
    Prezentace výsledků, semináře, ... 10%
    cca 4,200,000

Poznámka:
    Tato kalkulace předpokládá, že se bude realizovat alespoň 5 podobných akcí, do kterých se
    rozloží jednorázové náklady a náklady na znalost věci. Procentní navýšení v Celkových kalkulacích
    se počítá sumárně a ne kumulativně. Při komerční organizaci podobné studie je možno počítat
    tedy okrouhle s 10% ziskem v průběhu 12 měsíců celkem riskantní akce, která je velmi náročná
    na pracnost a iniciální investice.


Bullet Index


JLABS Aktualizováno dne 20010129. Komentář: info@jlabs.cz