JLabs.Pressant.Historie
Tento text je řazen proti proudu času, nejnovější položky vpředu. Při čtení na retrospektivu nebo
pro orientaci v houšti změn je nutno postupovat odzadu ... Preskripční studie je organizována po odborné stránce
skupinou vedenou primářem MUDr. V.Jindrákem, úlohou JLabs je zabezpečení statistické analýzy shromážděných
dat se vším všudy. Detaily obsahu studie zde nejsou zveřejňovány.
======================================================================================================================= Hodnocení změny atb léčby: Zvolené kategorie nejsou nutně správné. Případ je charakterizován změnou, tedy výskytem A-čka v aspoň jedné návštěve, pomineme-li případy, kdy je změna vlastně zahájením pohotovostí a schváleným naším lékařem. Změnu ale chrakterizujeme jako změnu skupiny antibiotik. Může být, že se měnil konkrétní lék, pečlivý lékař to zaznamenal, ale neměnila se skupina. Podobně i u dávkovaní, kde se mohla změnit pouze razance léčby. Jemnost sledování parametrů: V řadě případů je jemnost sledování případů až nepřiměřená. Zejména se to týká těch parametrů, kde se iterují všechny diagnózy proti všem skupinám atb a všem praxím. Celkem vzniká řádově 10,000 individuálních výsledků. Jenom jejich samotné spočítání trvá dlouho. To by tak moc nevadilo, horší je to, že statistická vypovídací schopnost takto atomizovaných dat je velmi malá. Relevantní výsledky budou spíše jenom za regiony a celkově. Přihlédneme-li k tomu, že se nějaké záznamy musely prohlásit za vadné, pak u řady lékařů bude při malých číslech výsledků ihned vidět, že něco nesedí. Podobně se projeví i případná zjednodušující kriteria ve výpočtu nebo přijaté kompromisy mezi absolutní kvalitou dat a realizovatelností analýzy. Postup analýzy step-by-step: 20021030-20021104 Sestaveny scénáře pro generování reportů. Zavedení a výpočet tzv. jmenovatelů pro výpočty procentních parametrů. Astronomické množství malých úprav a verifikace výsledků. 20021029 Příprava posledních parametrů, revize stávajících. Sepsána tato stránka. 20021028 Atomizovány všechny výpočty všech parametrů. Pojmenovány všechny parametry. Každý výpočet má tedy svůj stejnojmenný skript (algoritmus) a zadavatel studie může celkem přímočaře kontrolovat, co se vlastně počítá. Všechny výpočty jsou převedeny na uniformní a banální scénář s cílem snadné kontroly věcné správnosti: definuje se dataset, tedy množina odpovídající zkoumanému znaku tento dataset obashuje záznamy (epizody nebo návštěvy), které 1:1 odpovídají kýžené množině dataset je mechanicky posléze rozkrájen na kousky po praxích a regionech a vzniknou parciální výsledky 20021027 Opět intenzivní výpočty. Problémy se hromadí kolem přiliš velkého počtu mezivýsledků. Rozhodnuto, že se budou skladovat jenom ty výsledky, které jsou nenulové. Podobně rozhodnuto, že procentní výsledky budou počítány jenom just-in-time. Jenom jejich insertování do databáze zabírá zbytečných pár minut v každém běhu ... Největším viníkem složitosti analýzy je fakt, že se oslovuje hned několik záznamů najednou jako epizoda a občas každý záznam zvlášť. Výsledky budou nutně občas ovlivněny zjednodušením. Například počítáním diagnóz u dlouhých epizod apod. Asi se měla zavést váha, cosi jako počítat diagnózy váženě vůči délce epizody. Takto totiž dlouhé případy vydají za pět nebo více krátkých. 20021026 Velmi intenzivně počítány různé výsledky. Rozhodnutu vypočítat tabulku epizod a používat případ od případu buď tuto mezitabulku nebo haldu protokolů. Řada vnořených sql queries je sice syntakticky v pořádku, ale jejich počítání je neúměrně dlouhé i když se celá databáze nasaje do paměti a i na velmi výkonném počítači (1.8GHz a 1.5GB RAM). Rozhodnuto počítat průchody přes vypočítané datasety skriptem a ne přes SQL. Viníkem je velmi velký počet odesílaných sql queries, řádově 100,000. To je moc i pro rychlý server. Vzhledem k ne úplnému porozumění významu parametrů je potřeba analýzu počítat dokola x-krát a výsledky měřit zdravým rozumem. Rychlost je primární. Vytvořeno mnoho podružných indexů tak, že struktura indexů zabírá více místa než vlastní tabulky se záznamy o návštěvách. 20021025 Provedeny detailní revize pracovních scénářů. Provedena řada výpočtů různých parametrů. Odhaleny vesměs nevýznamné chyby v datech, vyjasněn význam řady parametrů. 20021024 Provedeny detailní revize pracovních scénářů. Získáno definitivní zadání pro výstupy analýzy. Vytvořeny první verze výstupů a výpočtů. Rozhodnuto oddělit fázi výpočtů od fáze sestavení výstupních sestav. Vyjasněny alespoň klíčové analytické skupiny co do významu. 20021008 - 20021010 Definována databáze. Vytvořen generický model. Vytipovány kategorie chybných údajů a sestaveny kontrolní pohledy. Vytvořeny vhodné pracovní tabulky. Prehistorie a Press: Sestavení aplikací. Analýza problematiky. Odladění. ======================================================================================================================= Kalkulace ex-ante pro rozpočet analogické akce: ----------------------------------------------------------------------------------------------------------------------- Cílem této sekce je pokusit se odhadnout přímočaře náklady na podobnou akci, kdyby se měla realizovat na komerční bázi. Nepočítáme v to případnou odměnu pro lékaře v praxích za vyplnění formulářů. Odhadem by to projekt prodražilo o cca 10% navíc. Shromážděný datový materiál je rozsáhlý a požadované analýzy jsou velmi složité. Vesměs se to vymyká běžným nárokům na statistické zpracování, hlavně z těchto důvodů: Zkušenost s podobnými projekty je malá. Je to celkem unikátní akce. Podstata věci ja ta, že se ortogonálně sledují případy i jejich sekvence nepredikovatelné délky. Význam požadovaných zkoumaných parametrů je vágní a je velmi pracné je krok po kroku vyjasnit. Výsledky výpočtů je potřeba průběžně měřit zdravým rozumem. Velká diskrepance v používaném jazyce mezi odbornou mikrobiologickou částí a statistickým zpracováním. Měřeno rozsahem a složitostí dat se jedná o cca 1% rozsahu sčítání lidu počtem záznamů a přibližně o 3 nebo 4% při započítání faktu, že zkoumaná data jsou mnohem složitější jak strukturou i vazbami než údaje o počtu lidí v domácnostech, pračkách apod. Závěr: Rozpočet by se měl pohybovat někde v okolí alespoň 1% rozpočtu na sčítání lidu, přinejmenším pro několik prvních auditů podobného ražení. Jinak je celý projekt někde postaven na dobrovolnické práci nebo nákladech hrazených skrytě. Přistoupíme-li na to, že státem organizované sčítání lidu je přece jenom veleakce zatížená ohromnými nadbytečnými náklady (propaganda kolem, výstavba budovy, koupení počítačů a celé sítě) i neefektivností, pak jako minimální traktabilní rozpočet ex-ante na podobnou akci je někde v okolí 5,000,000. Toto číslo je stanoveno mechanicky podle rozsahu a složitosti akce, níže se pokusíme popsat náklady položkově. ======================================================================================================================= Adresné náklady - odhady ----------------------------------------------------------------------------------------------------------------------- Odhadovaná specifická pracnost v analýze a implementaci: Press a celá akce s jeho rozjetím Pressant Balastní čas za atomizaci a nevyhnutelné iterace Samotné výpočty, ladění výstupních parametrů a sestav Odhadem 300h á 1,500.- a tedy cca 450,000 Skryté náklady na straně mikrobiologů Odborná definice studie - mikrobiologové Odborná analýza výsledků - mikrobiologové Průběžné byrokratické zabezpečení Know-how odhadem 2,000,000 - započteno 20% s ohledem na fyzickou možnost realizace podobných projektů v čase Odhadem 800,000 Náklady na zpracování dat Náklady na zpracování dat včetně amortizace počítačů software atd. cca 16 na jeden záznam, tedy cca 800,000 Statistické zpracování: Vybavení výpočetní technikou, alespoň 2ks server a 4ks stanice Vhodný software Vhodný a výkonný databázový systém Vývojové prostředí Standardní software Internetová konektivita Amortizace licencí všemožného software Administrátor systému Know-how Odhadem 4,000,000 jako nezbytné minimum - započteno 20% s ohledem na další využívání vybavení Tedy 800,000 Základní náklady celkem: 2,850,000 Celková kalkulace: Financování 12 měsíců předem - 12% Organizační režie - 10% Zisk 15% Prezentace výsledků, semináře, ... 10% cca 4,200,000 Poznámka: Tato kalkulace předpokládá, že se bude realizovat alespoň 5 podobných akcí, do kterých se rozloží jednorázové náklady a náklady na znalost věci. Procentní navýšení v Celkových kalkulacích se počítá sumárně a ne kumulativně. Při komerční organizaci podobné studie je možno počítat tedy okrouhle s 10% ziskem v průběhu 12 měsíců celkem riskantní akce, která je velmi náročná na pracnost a iniciální investice.