Базите данни ще играят много важна роля в научните изследвания, тъй като натрупваме все повече информация и се нуждаем от инструменти, стратегии и методологии, за да можем да използваме цялата тази информация, която генерираме. Досега бяхме в праисторията на това какво би било третирането на информацията и в бъдеще трябва да видим грандиозни промени в това отношение.

бази

Какво представляват базите данни и за какво са те?

Нашият общ интерес е да проучим диетата и храненето на индивиди или популации. За да се проучи диетата на индивида или популацията може да се направи по отношение на храната, но рано или късно ще трябва да проучим кои са химичните съединения, които този индивид или популация поглъща с тези храни, тъй като причинно-следствените връзки, които отиваме за да се опитаме да намерим, Най-лесният начин да ги установим е чрез изучаване на приема на химични съединения. А храната е много сложна от химическа гледна точка. В храната има хранителни вещества - основната причина за интерес - но има и безкрайност от съединения, някои със здравни защитни свойства, други с нежелани свойства и други без известна активност - поне досега -, но всички те влизат с нашето хранене.

Бихме могли да използваме химически анализ за изследване на диетата, но това би било непристъпна работа, поради което се нуждаем от данни за състава на храните. Тези данни могат да бъдат получени от научни статии, но това е трудно да се предположи и се нуждаем от документ, който събира цялата налична информация за химичния и хранителния състав. Тези данни ще ни позволят да оценим диетата на индивидите и населението, но те също така ще бъдат от съществено значение за планирането на диетата на тези индивиди и ще се опитаме да постигнем определени цели, които могат да бъдат хранителни препоръки, или ограничаване на приема на определени храни.

Следователно ние се съгласяваме, че едно от най-важните приложения на данните и таблиците за състава на храните е именно извършването на хранителни изследвания, при които приемът на тези съединения е количествено определен, но не е единствената употреба. Те могат също да бъдат необходими за планиране, за формулиране на определени храни в хранителната промишленост или за етикетиране на хранителни вещества на определени храни. И накрая, използването в преподаването, в университетите, където се внася диплома за човешко хранене и диететика, както и в лаборатории за анализ или за разработване на законови разпоредби.

Базите данни са колекции от данни, които са представителни за химичния състав на храните, тоест те трябва да представляват това, което ни интересува. Например, ако създадем испанска база данни за състава на храните, трябва да се опитаме тази база да представлява състава на храната, който може да се намери на испанския пазар.

Таблица или база данни за състава на храната е документът, който има по-опростена структура и в основата си се състои от три компонента: списък на храни, списък на хранителни вещества или химични съединения и стойности, за които информацията за състава.

Методи за разработване на база данни

Първият метод за приготвяне е директен, метод, който се състои от планиране на вземане на проби от храна, избор на аналитични техники и анализ на тези проби от храни. Данните се събират, компилират, в база данни и накрая се публикуват в електронен или печатен формат. Таблиците за състава могат да бъдат генерирани от базите данни за състава на храните.

Този метод има предимството, че контролираме целия процес. Контролира се дизайнът на плана за вземане на проби - което е много важно за постигане на представителност на базата данни -, планирането на плана за вземане на проби, изборът на аналитични техники и процесът на компилиране на данните. Ако го проектираме добре, този метод предлага този с най-високо качество на данните. Проблемът с този метод е, че е ужасно скъп. Анализът на една проба храна за основните хранителни вещества може да струва 3000 евро. Следователно се нуждаем от алтернатива, която ни позволява да икономисваме, което е косвеният метод.

Индиректният метод се състои в търсене на съществуваща информация за състава на храната, съставяне и предаване на проверка - за да се види дали тази информация отговаря на тези изисквания, на които сме установили, че трябва да отговарят. Не можем да контролираме нито вземането на проби, нито избора на аналитична техника. И понякога това, което имаме, не отговаря адекватно на нашите нужди. Например, ако се интересуваме данните да са представителни за съществуващите храни на испанския пазар, ако публикацията ни дава данни за храна, която обикновено не се среща на нашия пазар, тази информация е безполезна, не мога да я използвам, за да направя моята база данни.

Що се отнася до аналитичния метод за създаване на база данни за състава на храните за приложение в областта на храненето, има някои методи, които не работят. Следователно, ние трябва да предоставим данните на проверка (данни по данни), след което можем да ги компилираме и публикуваме. Предимството на този метод е, че е много по-евтин от предишния, но проблемът е, че изисква много време и персонал с известна подготовка.

Обикновено се използва комбинираният метод, който оптимизира съотношението цена/качество на базата данни. В този метод ние избираме храните, които имат по-голямо тегло в диетата на населението, към които искаме да разпределим базата данни и тези храни, ако ще ги вземаме и анализираме, за тези храни ще имаме висококачествени данни. Но за храни с ниско тегло ще следваме стратегията на индиректния метод: ще търсим информация и ще компилираме информацията, като я изпратим на изследване. И ние комбинираме данните от тези два метода в една и съща база данни. По принцип това е методът на избор. Той обаче има недостатък, е че при използване на косвения метод за получаване на данните за храни, които имат ниско тегло в диетата, ще имаме много неизвестни стойности, защото може би няма публикувана информация в това отношение или не сме е имал достъп до нея. По-късно ще видим как ще процедираме в тези случаи.

Информационни източници

Като източници на информация можем да направим анализите изрично - кои са звездните данни -, от друга страна, съществуващите данни, които ще извлечем от научни статии. Те имат своите предимства, тъй като тези статии са прегледани, следователно има филтър, но все пак трябва да ги прегледаме. Проблемът е, че отнема много време. Също така има възможност за консултация с докторски дисертации и други академични трудове и, накрая, данните, предоставени от компании, които също могат да бъдат използвани, но които може да не отговарят на изискванията, които сме установили за нашата база данни.

Не трябва да забравяме, че в рамките на информационната система, която сме създали за създаване на тази база данни, можем да генерираме данни. Например, за да изчислим общите въглехидрати, не е нужно да ги търсим, ако разполагаме с данните за захарите и полизахаридите, можем да изчислим общите. Можем също така да изчислим състава на храните от рецепти, очевидно имащи алгоритми и коефициенти за настройка за готвене. И накрая, можем също така да направим приблизителни оценки, това, което наричаме атрибуции и предположения - например да кажем, че марулята има нулев холестерол, е атрибуция, не е нужно да търся количеството холестерол в марулята, за да направя моята база данни, тъй като знам, че количеството е нула Присвоявам тази стойност и не е нужно да търся допълнително за този компонент. Между 15-20% от стойностите в базата данни са този тип директни "нули".

Какви храни трябва да включите в базата данни?

Зависи от целта на базата данни. Ако целта е да се включи хранителната информация на продуктите на компанията, тогава ще трябва да имате продуктите на компанията, очевидно е. Но какво трябва да имат националните бази данни? Националната база данни би трябвало да съдържа най-малко основните храни, които са тези, които допринасят 80 процента от всяко хранително вещество в диетата, и заедно те допринасят за 90 процента от всички хранителни вещества, които населението поглъща. Храни, които осигуряват важно количество хранителни вещества и които представляват интерес от гледна точка на общественото здраве. Например има храни, богати на желязо, които не са от съществено значение, но тъй като разпространението на желязната анемия е важно за нашето население, ние смятаме за интересно, че тази храна е в списъка. И накрая, търговски и икономически фактори, много пъти се избират храни, защото е интересно да се знае техният състав по търговски причини.

Как се решават основните храни? С данните от хранителното проучване на каталунското население можете да видите списъка с храни, които допринасят за 50 процента от приема на мазнини. Само 19 храни представляват 50 процента от приема на мазнини. Има храни, които очевидно трябва да се появят в списъка, като зехтин, майонеза или слънчогледово олио, но има и храни, които по принцип смятаме, че нямат зрелищно количество мазнини, но които се консумират в големи количества.

Описание на храната. Конфликти

Общите имена, които обикновено използваме, понякога не ни помагат да опишем адекватно храната и трябва да търсим други системи, които са много по-фини. В таблиците за състава се използва фасетирана система, това означава, че за всяка храна ще трябва да опишем най-важните аспекти, които ще ни помогнат да ги идентифицираме правилно и които ще избегнат объркване по отношение на други храни.

Системата Langual се управлява от този принцип на аспектите и всеки аспект има речник на термините, така че имаме ограничен списък с дескриптори за всеки аспект на храните и трябва да опишем храната, използвайки тези дескриптори, които периодично се ревизират и разширяват.

Класификация на храните

Системите за класификация на храните имат силен културен компонент, но има някои системи, които се опитват да бъдат универсални, една от тях е Eurocode 2. Това е много строга система за класификация, но е много интересна за тези, които са посветени на епидемиологията, защото може да бъде полезна за описване на приема на изследвани индивиди от гледна точка на групи храни.

Всички ще се съгласим, че трябва да бъдат включени всички хранителни вещества, проблемът е, че намирането на този обем информация е много трудно и трябва да дадем приоритет, ще можем да включим само тези хранителни вещества, за които има надеждна информация и че имаме пари за покрийте ги.

Идентификацията на хранителните вещества също има проблеми. Много пъти има пристрастни описания, например използването на аскорбинова киселина като синоним на витамин С не е правилно. Витамин С има няколко витамина, включително аскорбинова киселина и понякога можем да намерим някои таблици за състава, които ги използват като синоними. Правилното описание ще бъде с двата витамеро.

Идентифицирането на хранителните вещества също не е лесно и има системи, подобни на Langual, но посветени на хранителните вещества. Важно е да помислите какво е точното описание на всяко хранително вещество, когато използвате база данни. И единиците и формите на изразяване също са жизненоважни.

Има и аспекти, свързани с качеството на данните. Съществуват стратегии за проверка на данните и една от тях са системите за изследване на качеството на данните, за които се преглеждат планът за вземане на проби, броят на пробите, аналитичният метод и изпълнението на анализа. И един лесен начин да го направите е чрез рубрики, които се прилагат към всеки състав, за да се оцени качеството му.

Основни критерии за качество

Съществува декалог, на който базата данни за състава на храните трябва да отговаря. Що се отнася до хранителните вещества, трябва да поискаме адекватен списък, който отговаря на нашите нужди, с добра идентификация на хранителните вещества и който включва подробности за формите на изразяване. Що се отнася до храните, адекватен списък от тях и добро описание. А що се отнася до стойностите, има малко неизвестни стойности и че стойностите са с добро качество, поне проверени.