PyPI - sista-tacrpy - Versions diffs - 1.0.12__py3-none-any.whl - Mend

sista-tacrpy 1.0.12__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

sista_tacrpy-1.0.12.dist-info/METADATA +18 -0
sista_tacrpy-1.0.12.dist-info/RECORD +17 -0
sista_tacrpy-1.0.12.dist-info/WHEEL +5 -0
sista_tacrpy-1.0.12.dist-info/top_level.txt +1 -0
tacrpy/__init__.py +3 -0
tacrpy/analytics/__init__.py +0 -0
tacrpy/data_fetcher/__init__.py +3 -0
tacrpy/data_fetcher/googlesheets.py +237 -0
tacrpy/data_fetcher/isvavai.py +162 -0
tacrpy/data_fetcher/ssot.py +1006 -0
tacrpy/data_operations.py +70 -0
tacrpy/datahub/__init__.py +5 -0
tacrpy/datahub/data_lineage.py +86 -0
tacrpy/datahub/datasets.py +421 -0
tacrpy/datahub/glossary.py +378 -0
tacrpy/datahub/import_checks.py +123 -0
tacrpy/datahub/openapi.py +78 -0

tacrpy/data_fetcher/ssot.py ADDED Viewed

@@ -0,0 +1,1006 @@
+import pandas as pd
+import re
+from google.cloud import bigquery
+import google.auth.impersonated_credentials
+project_id = 'sista-data-stream'
+creds, pid = google.auth.default()
+target_scopes = [
+    "https://www.googleapis.com/auth/cloud-platform",
+    "https://www.googleapis.com/auth/drive"
+    ]
+print(f"Obtained default credentials for the project {pid}")
+tcreds = google.auth.impersonated_credentials.Credentials(
+    source_credentials=creds,
+    # target_principal="big-query-user@sista-data-stream.iam.gserviceaccount.com",
+    # target_principal="bq-reader@sista-data-stream.iam.gserviceaccount.com", # 1.0.6
+    target_principal="data-stream-bq@sista-data-stream.iam.gserviceaccount.com", # 1.0.7
+    # RefreshError: ('Unable to acquire impersonated credentials', '{\n  "error": {\n    "code": 403,\n    "message": "Permission \'iam.serviceAccounts.getAccessToken\' denied on resource (or it may not exist).",\n    "status": "PERMISSION_DENIED",\n    "details": [\n      {\n        "@type": "type.googleapis.com/google.rpc.ErrorInfo",\n        "reason": "IAM_PERMISSION_DENIED",\n        "domain": "iam.googleapis.com",\n        "metadata": {\n          "permission": "iam.serviceAccounts.getAccessToken"\n        }\n      }\n    ]\n  }\n}\n')
+    target_scopes=target_scopes
+)
+client = bigquery.Client(credentials=tcreds, project=project_id)
+#? credentials a vsechno funguji
+#! uz ne????
+class Projects:
+    """ Třída, která načítá a reprezentuje tabulku projektů.
+    Funguje pouze v rámci Google Colab prostředí.
+    :param projects: DataFrame načtených dat ze zdroje pravdy nebo z nově vytvořené (vyfiltrované) instance
+    :type projects: DataFrame
+    :param summary_cfp: DataFrame s agregovanými údaji na úrovni veřejných soutěží
+    :type summary_cfp: DataFrame
+    :param summary_prog: DataFrame s agregovanými údaji na úrovni programů
+    :type summary_prog: DataFrame
+    """
+    def __init__(self, df: object = None):
+        """ Konstruktor, který načte data do DataFrame a vytvoří agregovanou tabulku.
+        """
+        if df is None:
+            self.projects = self._get_projects()
+        else:
+            self.projects = df
+        # self.summary_cfp = self.create_summary() #! az dopisu create_summary() tak odkomentovat !!
+        # self.summary_prog = self.create_summary('prog') #! az dopisu create_summary() tak odkomentovat !!
+    #? DONE, TESTED, vola se stejne, funguje beze zmeny
+    def _get_projects(self) -> pd.DataFrame:
+        """ Načte data o projektech z databáze zdroje pravdy v Bigquery.
+           Lze použít pouze v rámci Google Colab prostředí.
+        :return: DataFrame načtených dat
+        """
+        # data-poc-424211.ssot.Projekty_ssot
+        # sista-data-stream.ssot.projects
+        query = """
+        SELECT *
+        FROM `sista-data-stream.ssot.projects`
+        """
+        df = client.query(query).to_dataframe()
+        return df
+    #? DONE, TESTED helper function, melo by fungovat by default, porad ty stejne datove typy atd
+    def _check_missing_items(self, provided_items: tuple, existing_items: list, item_name: str):
+        """Ověří, zda se všechny zadané položky nacházejí v existujícím seznamu.
+        Pokud jsou nalezeny chybějící položky, vyvolá ValueError s chybovou zprávou.
+        :param provided_items: Tuple položek zadaných pro filtrování.
+        :param existing_items: Seznam všech unikátních položek nacházejících se v datové sadě.
+        :param item_name: Popisný název položky, který se použije v chabové hlášce.
+        :raises ValueError: Pokud alespoň jedna zadaná položka neexistuje v datové sadě.
+        """
+        missing_items = [item for item in provided_items if item not in existing_items]
+        if missing_items:
+            raise ValueError(f'{item_name} {missing_items} neexistuje/neexistují.')
+    # TODO: tohle bude oser (mozna)
+    def create_summary(self, level: str = 'cfp') -> pd.DataFrame:
+        """ Vytvoří agregovaný souhrn buď na úrovni veřejných soutěží (defaultní) nebo na úrovni programů.
+        :param level: určuje, na jaké úrovni se provede agregace
+                    * 'cfp' (defaultní) - na úrovni veřejných soutěží
+                    * 'prog' - na úrovni programů
+        :return: agregovaný DataFrame, který obsahuje:
+                    * Počet podaných projektů
+                    * Počet podpořených projektů
+                    * Náklady podpořených projektů
+                    * Podpora podpořených projektů
+        """
+        if level not in ['cfp', 'prog']:
+            raise ValueError('Neexistující forma agregace.')
+        temp_df = self.projects.copy()
+        temp_df['Podpořené'] = temp_df.apply(
+            lambda x: 'Ano' if x['faze_projektu'] in ['Realizace', 'Implementace', 'Ukončené'] else 'Ne', axis=1)
+        submitted = temp_df.groupby(['kod_programu', 'kod_VS']).agg(
+            {'kod_projektu': 'count', 'naklady_celkem': 'sum', 'podpora_celkem': 'sum'}).reset_index()
+        funded = temp_df[temp_df['Podpořené'] == 'Ano'].groupby(['kod_programu', 'kod_VS']).agg(
+            {'kod_projektu': 'count', 'naklady_celkem': 'sum', 'podpora_celkem': 'sum'}).reset_index()
+        summary_df = pd.merge(submitted[['kod_programu', 'kod_VS', 'kod_projektu']], funded, how='inner',
+                              on=['kod_programu', 'kod_VS'])
+        summary_df.columns = ['kod_programu', 'kod_VS', 'Podané', 'Podpořené', 'Náklady', 'Podpora']
+        if level == 'cfp':
+            pass
+        elif level == 'prog':
+            summary_df = summary_df.groupby('kod_programu').agg('sum', numeric_only=True).reset_index()
+        return summary_df
+    #? DONE, TESTED , vola se stejne, funguje beze zmeny
+    def select_programme(self, *args: str) -> 'Projects':
+        """ Vyfiltruje dataframe projektů tak, aby obsahovala pouze projekty vybraných programů.
+        :param args: kódy programů (dvoumístné - například 'FW'), které se mají vyfiltrovat
+        :return: nová instance třídy Projects s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        # existing_programmes = self.projects['kod_programu'].unique()
+        existing_programmes = self.projects['programme_code'].unique()
+        self._check_missing_items(args, existing_programmes, 'Programy')
+        programme_list = [prog for prog in args]
+        # select_df = self.projects[self.projects['kod_programu'].isin(programme_list)].reset_index(drop=True)
+        select_df = self.projects[self.projects['programme_code'].isin(programme_list)].reset_index(drop=True)
+        return Projects(select_df)
+    #? DONE, TESTED, vola se stejne, funguje beze zmeny
+    def select_cfp(self, *args: str) -> 'Projects':
+        """ Vyfiltruje dataframe projektů tak, aby obsahovala pouze projekty vybraných veřejných soutěží.
+       :param args: kódy veřejných soutěží (čtyřmístné - například 'FW01'), které se mají vyfiltrovat
+       :return: nová instance třídy Projects s vyfiltrovanými údaji
+       :raise: ValueError
+       """
+        # existing_cfp = self.projects['kod_VS'].unique()
+        existing_cfp = self.projects['cfp_code'].unique()
+        self._check_missing_items(args, existing_cfp, 'Veřejné soutěže')
+        cfp_list = [cfp for cfp in args]
+        select_df = self.projects[self.projects['cfp_code'].isin(cfp_list)].reset_index(drop=True)
+        return Projects(select_df)
+    #? DONE, , rename to `select_financed()`
+    def select_funded(self) -> 'Projects':
+        """ Vyfiltruje dataframe projektů tak, aby obsahoval pouze podpořené projekty.
+        :return: nová instance třídy Projects s vyfiltrovanými údaji
+        """
+        financed_states = ['400','500', '600']
+        # funded_states = ['Realizace', 'Implementace', 'Ukončené']
+        # select_df = self.projects[self.projects['faze_projektu'].isin(funded_states)].reset_index(drop=True)
+        select_df = self.projects[self.projects['project_state'].isin(financed_states)].reset_index(drop=True)
+        return Projects(select_df)
+    #TODO: jak fungujou cepy, @Vojta
+    def select_cep(self, level: int, *args: str) -> 'Projects':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze projekty vybraných oborů nebo skupin oborů klasifikace CEP
+        :param level: úroveň - 1 = skupiny oborů CEP, 2 = obory CEP
+        :param args: kódy skupin oborů CEP (1 písmeno) nebo oborů CEP (2 písmena), které se mají vyfiltrovat
+              úroveň 1 - skupiny oborů:
+                               * A	= A - Společenské vědy
+                               * B	= B - Fyzika a matematika
+                               * C	= C - Chemie
+                               * D	= D - Vědy o zemi
+                               * E	= E - Biovědy
+                               * F	= F - Lékařské vědy
+                               * G	= G - Zemědělství
+                               * I	= I - Informatika
+                               * J	= J - Průmysl
+                               * K	= K - Vojenství a politika
+              úroveň 2 - obory CEP dostupná zde https://docs.google.com/spreadsheets/d/1VknMmHAjKspJmyYlCeJCVEOn01xFGETbTNKi4dMvqf8/edit#gid=0
+        :return: nová instance třídy Projects s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        if level == 1:
+            incorrect_level = [lvl for lvl in args if len(lvl) != 1]
+            if incorrect_level:
+                raise ValueError("Pro úroveň 1 (Skupina oborů CEP) je nutné zvolit pouze jednopísmenný kód!")
+            else:
+                cep1_enum = ["A", "B", "C", "D", "E", "F", "G", "I", "J", "K"]
+                incorrect_cep1 = [cep1 for cep1 in args if cep1 not in cep1_enum]
+                if incorrect_cep1:
+                    raise ValueError(f"Skupina oborů CEP {incorrect_cep1} není v číselníku skupin oborů CEP!")
+                else:
+                    existing_cep1 = self.projects['cep1'].str[:1].unique()
+                    missing_cep1 = [cep1 for cep1 in args if cep1 not in existing_cep1]
+                    if missing_cep1:
+                        raise ValueError(
+                            f"Žádný projekt ze skupiny oborů CEP {missing_cep1} není v zadaném výběru nebo v této skupině oborů vůbec nebyl v TA ČR žádný projekt podpořen.")
+                    else:
+                        cep1_list = [cep1 for cep1 in args]
+                        select_df = self.projects[self.projects['cep1'].str[:1].isin(cep1_list)].reset_index(drop=True)
+                        return Projects(select_df)
+        elif level == 2:
+            incorrect_level = [lvl for lvl in args if len(lvl) != 2]
+            if incorrect_level:
+                raise ValueError("Pro úroveň 2 (Obory CEP) je nutné zvolit pouze dvoupísmenný kód!")
+            else:
+                cep2_enum = [
+                    'AA', 'AB', 'AC', 'AD', 'AE', 'AF', 'AG', 'AH', 'AI', 'AJ', 'AK', 'AL', 'AM', 'AN', 'AO', 'AP', 'AQ'
+                    , 'BA', 'BB', 'BC', 'BD', 'BE', 'BF', 'BG', 'BH', 'BI', 'BJ', 'BK', 'BL', 'BM', 'BN', 'BO'
+                    , 'CA', 'CB', 'CC', 'CD', 'CE', 'CF', 'CG', 'CH', 'CI'
+                    , 'DA', 'DB', 'DC', 'DD', 'DE', 'DF', 'DG', 'DH', 'DI', 'DJ', 'DK', 'DL', 'DM', 'DN', 'DO'
+                    , 'EA', 'EB', 'EC', 'ED', 'EE', 'EF', 'EG', 'EH', 'EI'
+                    , 'FA', 'FB', 'FC', 'FD', 'FE', 'FF', 'FG', 'FH', 'FI', 'FJ', 'FK', 'FL', 'FM', 'FN', 'FO', 'FP',
+                    'FQ', 'FR', 'FS'
+                    , 'GA', 'GB', 'GC', 'GD', 'GE', 'GF', 'GG', 'GH', 'GI', 'GJ', 'GK', 'GL', 'GM'
+                    , 'IN'
+                    , 'JA', 'JB', 'JC', 'JD', 'JE', 'JF', 'JG', 'JH', 'JI', 'JJ', 'JK', 'JL', 'JM', 'JN', 'JO', 'JP',
+                    'JQ', 'JR', 'JS', 'JT', 'JU', 'JV', 'JW', 'JY'
+                    , 'KA']
+                incorrect_cep2 = [cep2 for cep2 in args if cep2 not in cep2_enum]
+                if incorrect_cep2:
+                    raise ValueError(f"Obor {incorrect_cep2} není v číselníku oborů CEP!")
+                else:
+                    existing_cep2 = self.projects['cep1'].str[:2].unique()
+                    missing_cep2 = [cep2 for cep2 in args if cep2 not in existing_cep2]
+                    if missing_cep2:
+                        raise ValueError(
+                            f"Žádný projekt s oborem CEP {missing_cep2} není v zadaném výběru nebo s tímto oborem vůbec nebyl v TA ČR žádný projekt podpořen.")
+                    else:
+                        cep2_list = [cep2 for cep2 in args]
+                        select_df = self.projects[self.projects['cep1'].str[:2].isin(cep2_list)].reset_index(drop=True)
+                        return Projects(select_df)
+        else:
+            raise ValueError("Lze zvolit pouze úroveň 1 nebo 2")
+    #TODO @Vojta, jak fungujou fordy
+    def select_ford(self, level, *args: str) -> 'Projects':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze projekty vybraných oborů nebo
+        skupin oborů klasifikace FORD
+        :param level: úroveň - 1 = Vědní oblast, 2 = FIELDS OF RESEARCH AND DEVELOPMENT (FORD), 3 = DETAILED FORD
+        :param args: kódy úrovní oborů FORD (1,2 nebo 3-písmenný), které se mají vyfiltrovat
+              úroveň 1 - skupiny oborů
+                        * 1	= 1. Natural Sciences
+                        * 2	= 2. Engineering and Technology
+                        * 3	= 3. Medical and Health Sciences
+                        * 4	= 4. Agricultural and veterinary sciences
+                        * 5	= 5. Social Sciences
+                        * 6 = 6. Humanities and the Arts
+              podrobně rozepsaná úroveň 2 (FIELDS OF RESEARCH AND DEVELOPMENT (FORD))
+              a úroveň 3 (DETAILED FORD) jsou dostupnézde https://docs.google.com/spreadsheets/d/1J5OChOGxdTZGXOAMeU0icp5Kiz88BhSndRbxJ94A0nc/edit#gid=0
+        :return: nová instance třídy Projects s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        self.projects["ford_code"] = self.projects["ford1"].apply(
+            lambda text: re.search(r'\b(\d{5})\b', text).group(1) if isinstance(text, str) and text and re.search(
+                r'\b(\d{5})\b', text) else None)
+        if level == 1:
+            incorrect_level = [lvl for lvl in args if len(lvl) != 1]
+            if incorrect_level:
+                raise ValueError("Pro úroveň 1 (Vědní oblast) je nutné zvolit pouze jednočíselný kód!")
+            else:
+                ford1_enum = ['1', '2', '3', '4', '5', '6']
+                incorrect_ford1 = [ford1 for ford1 in args if ford1 not in ford1_enum]
+                if incorrect_ford1:
+                    raise ValueError(f"Vědní oblast FORD {incorrect_ford1} není v číselníku FORD!")
+                else:
+                    existing_ford1 = self.projects['ford_code'].str[:1].unique()
+                    missing_ford1 = [ford1 for ford1 in args if ford1 not in existing_ford1]
+                    if missing_ford1:
+                        raise ValueError(
+                            f"Žádný projekt z Vědního oboru FORD {missing_ford1} není v zadaném výběru nebo vůbec nebyl v TA ČR žádný takový projekt podpořen.")
+                    else:
+                        ford1_list = [ford1 for ford1 in args]
+                        select_df = self.projects[self.projects['ford_code'].str[:1].isin(ford1_list)].reset_index(
+                            drop=True)
+                        return Projects(select_df)
+        elif level == 2:
+            incorrect_level = [lvl for lvl in args if len(lvl) != 3]
+            if incorrect_level:
+                raise ValueError(
+                    "Pro úroveň 2 (FIELDS OF RESEARCH AND DEVELOPMENT (FORD)) je nutné zvolit pouze trojčíselný kód!")
+            else:
+                ford2_enum = ['101', '102', '103', '104', '105', '106', '107'
+                    , '201', '202', '203', '204', '205', '206', '207', '208', '209', '210', '211'
+                    , '301', '302', '303', '304', '305'
+                    , '401', '402', '403', '404', '405'
+                    , '501', '502', '503', '504', '505', '506', '507', '508', '509'
+                    , '601', '602', '603', '604', '605']
+                incorrect_ford2 = [ford2 for ford2 in args if ford2 not in ford2_enum]
+                if incorrect_ford2:
+                    raise ValueError(f"Obor {incorrect_ford2} není v číselníku oborů FORD!")
+                else:
+                    existing_ford2 = self.projects['ford_code'].str[:3].unique()
+                    missing_ford2 = [ford2 for ford2 in args if ford2 not in existing_ford2]
+                    if missing_ford2:
+                        raise ValueError(
+                            f"Žádný projekt s oborem FORD {missing_ford2} není v zadaném výběru nebo s tímto oborem vůbec nebyl v TA ČR žádný projekt podpořen.")
+                    else:
+                        ford2_list = [ford2 for ford2 in args]
+                        select_df = self.projects[self.projects['ford_code'].str[:3].isin(ford2_list)].reset_index(
+                            drop=True)
+                        return Projects(select_df)
+        elif level == 3:
+            incorrect_level = [lvl for lvl in args if len(lvl) != 5]
+            if incorrect_level:
+                raise ValueError("Pro úroveň 3 (DETAILED FORD) je nutné zvolit pouze pětičíselný kód!")
+            else:
+                ford3_enum = ['10101', '10102', '10103', '10201', '10301', '10302', '10303', '10304', '10305', '10306',
+                              '10307', '10308', '10401', '10402', '10403', '10404', '10405', '10406', '10501', '10502',
+                              '10503', '10504', '10505', '10506', '10507', '10508', '10509', '10510', '10511', '10601',
+                              '10602', '10603', '10604', '10605', '10606', '10607', '10608', '10609', '10610', '10611',
+                              '10612', '10613', '10614', '10615', '10616', '10617', '10618', '10619', '10620'
+                    , '20101', '20102', '20103', '20104', '20201', '20202', '20203', '20204', '20205', '20206', '20301',
+                              '20302', '20303', '20304', '20305', '20306', '20401', '20402', '20501', '20502', '20503',
+                              '20504', '20505', '20506', '20601', '20602', '20701', '20702', '20703', '20704', '20705',
+                              '20706', '20707', '20801', '20802', '20803', '20901', '20902', '20903', '21001', '21002',
+                              '21101'
+                    , '30101', '30102', '30103', '30104', '30105', '30106', '30107', '30108', '30109', '30201', '30202',
+                              '30203', '30204', '30205', '30206', '30207', '30208', '30209', '30210', '30211', '30212',
+                              '30213', '30214', '30215', '30216', '30217', '30218', '30219', '30220', '30221', '30223',
+                              '30224', '30225', '30226', '30227', '30229', '30230', '30301', '30302', '30303', '30304',
+                              '30305', '30306', '30307', '30308', '30309', '30310', '30311', '30312', '30401', '30402',
+                              '30403', '30404', '30405', '30501', '30502'
+                    , '40101', '40102', '40103', '40104', '40105', '40106', '40201', '40202', '40203', '40301', '40401',
+                              '40402', '40403'
+                    , '50101', '50102', '50103', '50201', '50202', '50203', '50204', '50205', '50206', '50301', '50302',
+                              '50401', '50402', '50403', '50404', '50501', '50502', '50601', '50602', '50603', '50701',
+                              '50702', '50703', '50704', '50801', '50802', '50803', '50804', '50901', '50902'
+                    , '60101', '60102', '60201', '60202', '60203', '60204', '60205', '60206', '60301', '60302', '60303',
+                              '60304', '60401', '60402', '60403', '60404', '60405', '60501']
+                incorrect_ford3 = [ford3 for ford3 in args if ford3 not in ford3_enum]
+                if incorrect_ford3:
+                    raise ValueError(f"Obor {incorrect_ford3} není v číselníku oborů CEP!")
+                else:
+                    existing_ford3 = self.projects['ford_code'].str[:5].unique()
+                    missing_ford3 = [ford3 for ford3 in args if ford3 not in existing_ford3]
+                    if missing_ford3:
+                        raise ValueError(
+                            f"Žádný projekt s oborem FORD {missing_ford3} není v zadaném výběru nebo s tímto oborem vůbec nebyl v TA ČR žádný projekt podpořen.")
+                    else:
+                        ford3_list = [ford3 for ford3 in args]
+                        select_df = self.projects[self.projects['ford_code'].str[:5].isin(ford3_list)].reset_index(
+                            drop=True)
+                        return Projects(select_df)
+        else:
+            raise ValueError("Lze zvolit pouze úroveň 1,2 nebo 3")
+#TODO: kde se to vubec bere??? `applicants`
+class Organizations: #! JE TO `Applicants` v ssot
+    """ Třída, která načítá a reprezentuje tabulku organizací.
+    Funguje pouze v rámci Google Colab prostředí.
+    :param organizations: DataFrame načtených dat ze zdroje nebo z nově vytvořené (vyfiltrované) instance
+    :type organizations: DataFrame
+    :param summary_cfp: DataFrame s agregovanými údaji na úrovni veřejných soutěží
+    :type summary_cfp: DataFrame
+    :param summary_prog: DataFrame s agregovanými údaji na úrovni programů
+    :type summary_prog: DataFrame
+    :param summary_ico: DataFrame s agregovanými údaji na úrovni organizací
+    :type summary_ico: DataFrame
+    """
+    def __init__(self, df: object = None):
+        """ Kontstruktor, který načte data do DataFrame, očistí finanční hodnoty a vytvoří agregovanou tabulku.
+        :param df: dataframe instance Project
+        """
+        if df is None:
+            self.organizations = self._get_organizations()
+            self._data_preparing()
+        else:
+            self.organizations = df
+        self.summary_cfp = self.create_summary()
+        self.summary_prog = self.create_summary('prog')
+        self.summary_ico = self.create_summary('ico')
+    #? DONE, , nebudu prejmenovavat, uzivatelsky se to nevola, bordel to tedy nepacha
+    def _get_organizations(self) -> pd.DataFrame:
+        """ Načte data o organizacích ze "zdroje pravdy" z databázového úložiště BigQuery.
+        Lze použít pouze v rámci Google Colab prostředí.
+        :return: DataFrame načtených dat ze zdroje
+        """
+        query = """
+        SELECT *
+        FROM `sista-data-stream.ssot.applicants`
+        """
+        df = client.query(query).to_dataframe()
+        return df
+    #? DONE, , watafak (......#TODO: tohle je potreba, tohle se vola hned z initu)
+    def _data_preparing(self):
+        """ Interní funkce, která doplní potřebná data, které nejsou ve zdroji pravdy v tabulce organizací.
+        """
+        self.organizations["kod_program"] = self.organizations["project_code"].str[:2]
+        if ["kod_program"] == 'TG': #! GAMMA ma vyjimku, posrali kody - elegantni reseni: vycist rovnou z ssot.projects
+            self.organizations["kod_vs"] = self.organizations["project_code"].str[:6]
+        else:
+            self.organizations["kod_vs"] = self.organizations["project_code"].str[:4]
+        # self.organizations["typeorg_kod"] = self.organizations["typ_organizace"].str[:2]
+        self.organizations["typeorg_kod"] = self.organizations["type"] # uz tam davame do nazvu jen ty dvoupismenne kody
+        # map_roles = {"Příjemce": "HP", "Hlavní příjemce": "HP", "Zahraniční partner": "ZU", "Další účastník": "DU"}
+        map_roles = {"main": "HP", "foreign-partner": "ZU", "additional": "DU"}
+        self.organizations["role_kod"] = self.organizations["role"].map(map_roles) # role v novem: mame foreign-partner, main, additional
+        map_kraj = {
+            "Hlavní město Praha": "PH",
+            "Středočeský kraj": "ST",
+            "Ústecký kraj": "US",
+            "Liberecký kraj": "LI",
+            "Pardubický kraj": "PA",
+            "Královéhradecký kraj": "KR",
+            "Karlovarský kraj": "KA",
+            "Plzeňský kraj": "PL",
+            "Jihočeský kraj": "JC",
+            "Kraj Vysočina": "VY",
+            "Jihomoravský kraj": "JM",
+            "Zlínský kraj": "ZL",
+            "Olomoucký kraj": "OL",
+            "Moravskoslezský kraj": "MO",
+            # "ZAH": "ZP"
+        } #TO DO: if zahranicni tak `null`
+        # self.organizations["kraj_kod"] = self.organizations["kraj"].map(map_kraj)
+        self.organizations["kraj_kod"] = self.organizations["kraj"].map(map_kraj).fillna("ZP")
+        query = """
+        SELECT *
+        FROM `sista-data-stream.ssot.projects`
+        """
+        projekty_df = client.query(query).to_dataframe()
+        self.organizations = pd.merge(self.organizations,
+                                    #   projekty_df[["kod_projektu", "faze_projektu", "stav_projektu"]], on='kod_projektu',
+                                      projekty_df[["project_code", "project_state", "project_substate"]], on='project_code',
+                                      how="left")
+    #? DONE, , melo by byt beze zmen.
+    def _check_missing_items(self, provided_items: tuple, existing_items: list, item_name: str):
+        """Ověří, zda se všechny zadané položky nacházejí v existujícím seznamu.
+        Pokud jsou nalezeny chybějící položky, vyvolá ValueError s chybovou zprávou.
+        :param provided_items: Tuple položek zadaných pro filtrování.
+        :param existing_items: Seznam všech unikátních položek nacházejících se v datové sadě.
+        :param item_name: Popisný název položky, který se použije v chabové hlášce.
+        :raises ValueError: Pokud alespoň jedna zadaná položka neexistuje v datové sadě.
+        """
+        missing_items = [item for item in provided_items if item not in existing_items]
+        if missing_items:
+            raise ValueError(f'{item_name} {missing_items} neexistuje/neexistují.')
+    #TODO: not mentally ready for this yet
+    def create_summary(self, level: str = 'cfp') -> pd.DataFrame:
+        """ Vytvoří agregovaný souhrn buď na úrovni veřejných soutěží (defaultní),na úrovni programů
+        nebo organizací.
+        :param level: určuje, na jaké úrovni se provede agregace
+                      * 'cfp' (defaultní) - na úrovni veřejných soutěží
+                      * 'prog' - na úrovni programů
+                      # 'ico' - na úrovni jednotlivých organizací
+        :return: agregovaný DataFrame, který obsahuje:
+                * Počet žádostí o podporu
+                * Počet účastí v podpořených projektech
+                * Náklady organizace/organizací v podpořených projektech
+                * Podpora organizace/organizací v podpořených projektech
+        """
+        if level not in ['cfp', 'prog', 'ico']:
+            raise ValueError('Neexistující forma agregace.')
+        temp_df = self.organizations.copy()
+        temp_df['Podpořené'] = temp_df.apply(
+            lambda x: 'Ano' if x['faze_projektu'] in ['Realizace', 'Implementace', 'Ukončené'] else 'Ne', axis=1)
+        if level == 'ico':
+            submitted = temp_df.groupby('ICO_organizace').agg({'kod_projektu': 'nunique'}).reset_index()
+            funded = temp_df[temp_df['Podpořené'] == 'Ano'].groupby('ICO_organizace').agg(
+                {'kod_projektu': 'nunique', 'naklady_celkem': 'sum', 'podpora_celkem': 'sum'}).reset_index()
+            summary_df = pd.merge(submitted, funded, how='left', on='ICO_organizace',
+                                  suffixes=('_podane', '_podporene'))
+            summary_df.rename(columns={'kod_projektu_podane': 'Podané', 'kod_projektu_podporene': 'Podpořené'},
+                              inplace=True)
+            summary_df.fillna(0, inplace=True)
+            summary_df['Podpořené'] = summary_df['Podpořené'].astype(int)
+            summary_df = summary_df.sort_values('podpora_celkem', ascending=False).reset_index(drop=True)
+            return summary_df
+        else:
+            submitted = temp_df.groupby(['kod_program', 'kod_vs']).agg(
+                {'ICO_organizace': 'count', 'naklady_celkem': 'sum', 'podpora_celkem': 'sum'}).reset_index()
+            funded = temp_df[temp_df['Podpořené'] == 'Ano'].groupby(['kod_program', 'kod_vs']).agg(
+                {'ICO_organizace': 'count', 'naklady_celkem': 'sum', 'podpora_celkem': 'sum'}).reset_index()
+            summary_df = pd.merge(submitted[['kod_program', 'kod_vs', 'ICO_organizace']], funded, how='inner',
+                                  on=['kod_program', 'kod_vs'])
+            summary_df.columns = ['kod_program', 'kod_vs', 'Podané', 'Podpořené', 'Náklady', 'Podpora']
+            if level == 'prog':
+                summary_df = summary_df.groupby('kod_program').agg('sum', numeric_only=True).reset_index()
+            return summary_df
+    #? DONE, ,
+    def select_ico(self, *args: str) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze konkrétní vybrané organizace na základě zadaného IČ.
+        :param args: IČ organizace/organizací, které se mají vyfiltrovat
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        # existing_ico = self.organizations['ICO_organizace'].unique()
+        existing_ico = self.organizations['id_number'].unique()
+        self._check_missing_items(args, existing_ico, 'Organizace')
+        ico_list = [ico for ico in args]
+        select_df = self.organizations[self.organizations['id_number'].isin(ico_list)].reset_index(drop=True)
+        return Organizations(select_df)
+    #? DONE, , tohle by nemelo byt potreba delat, tohle je osetrene v `_data_preparing()`
+    def select_programme(self, *args: str) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze organizace z vybraných programů.
+        :param args: kódy programů, které se mají vyfiltrovat
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        existing_programmes = self.organizations['kod_program'].unique()
+        self._check_missing_items(args, existing_programmes, 'Programy')
+        programme_list = [prog for prog in args]
+        select_df = self.organizations[self.organizations['kod_program'].isin(programme_list)].reset_index(drop=True)
+        return Organizations(select_df)  # todo maybe another class Programms?
+    #? DONE, , again osetreno v `_data_preparing()`
+    def select_cfp(self, *args: str) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze organizace z vybraných veřejných soutěží.
+        :param args: kódy veřejných soutěží, které se mají vyfiltrovat
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        existing_cfp = self.organizations['kod_vs'].unique()
+        self._check_missing_items(args, existing_cfp, 'Veřejné soutěže')
+        cfp_list = [cfp for cfp in args]
+        select_df = self.organizations[self.organizations['kod_vs'].isin(cfp_list)].reset_index(drop=True)
+        return Organizations(select_df)
+    #? DONE, , project_state to bere diky _data_preparing()
+    def select_funded(self) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze organizace v podpořených projektech.
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        """
+        financed_states = ['400', '500', '600']
+        # funded_states = ['Realizace', 'Implementace', 'Ukončené'] # realizace: 500, imple+ukoncene: 600
+        # select_df = self.organizations[self.organizations['faze_projektu'].isin(financed_states)].reset_index(drop=True)
+        select_df = self.organizations[self.organizations['project_state'].isin(financed_states)].reset_index(drop=True)
+        return Organizations(select_df)
+    #? DONE, , melo by byt osetrene z `_data_preparing()`
+    def select_type(self, *args: str) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze organizace podle vybraného typu organizace.
+        :param args: kódy typu organizací, které se mají vyfiltrovat
+                    * UP = mikro podnik
+                    * MP = malý podnik
+                    * SP = střední podnik
+                    * VP = velký podnik
+                    * VO = výzkumná organizace
+                    * DPO = další právnické osoby veřejného i soukromého práva
+                    * O = ostatní uchazeči povolení ZD
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        # co je typeorg: self.organizations["typeorg_kod"] = self.organizations["type"] # uz tam davame do nazvu jen ty dvoupismenne kody
+        existing_orgtype = self.organizations['typeorg_kod'].unique()
+        self._check_missing_items(args, existing_orgtype, 'Typy organizace')
+        orgtype_list = [orgtype for orgtype in args]
+        select_df = self.organizations[self.organizations['typeorg_kod'].isin(orgtype_list)].reset_index(drop=True)
+        return Organizations(select_df)
+    #? DONE, , again `_data_preparing()`
+    def select_role(self, *args: str) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze organizace podle vybraného typu role.
+        :param args: kódy rolí, které se mají vyfiltrovat
+                    * HP = hlavní příjemce
+                    * DU = další účastník
+                    * ZU = zahraniční účastník
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        # jak to funguje:
+            # map_roles = {"main": "HP", "foreign-partner": "ZU", "additional": "DU"}
+            # self.organizations["role_kod"] = self.organizations["role"].map(map_roles) # role v novem: mame foreign-partner, main, additional
+        existing_roles = self.organizations['role_kod'].unique()
+        self._check_missing_items(args, existing_roles, 'Role')
+        roles_list = [role for role in args]
+        select_df = self.organizations[self.organizations['role_kod'].isin(roles_list)].reset_index(drop=True)
+        return Organizations(select_df)
+    #? DONE, , again `_data_preparing()`
+    def select_region(self, *args: str) -> 'Organizations':
+        """ Vyfiltruje tabulku tak, aby obsahovala pouze organiazce podle vybraného kraje.
+        :param args: kódy krajů, které se mají vyfiltrovat
+                    * PH = Hlavní město Praha
+                    * ST = Středočeský kraj
+                    * US = Ústecký kraj
+                    * LI = Liberecký kraj
+                    * PA = Pardubický kraj
+                    * KR = Královéhradecký kraj
+                    * KA = Karlovarský kraj
+                    * PL = Plzeňský kraj
+                    * JC = Jihočeský kraj
+                    * VY = Kraj Vysočina
+                    * JM = Jihomoravský kraj
+                    * ZL = Zlínský kraj
+                    * OL = Olomoucký kraj
+                    * MO = Moravskoslezský kraj
+                    * ZP = ZAH
+        :return: nová instance třídy Organizations s vyfiltrovanými údaji
+        :raise: ValueError
+        """
+        existing_kraje = self.organizations['kraj_kod'].unique()
+        self._check_missing_items(args, existing_kraje, 'Kraje')
+        kraje_list = [kraj for kraj in args]
+        select_df = self.organizations[self.organizations['kraj_kod'].isin(kraje_list)].reset_index(drop=True)
+        return Organizations(select_df)
+#? DONE, , #TODO: tohle ma vlastni polozku v ssot
+def projects_finance() -> pd.DataFrame:
+    """ Načte data o financích projektů z databáze zdroje pravdy v Bigquery.
+    Finance jsou v rozdělení po jednotlivých letech.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+        #    FROM `data-poc-424211.ssot.Projekty_finance_ssot`
+    query = """
+           SELECT *
+           FROM `sista-data-stream.ssot.projects_finances`
+           """
+    df = client.query(query).to_dataframe()
+    return df
+#? DONE, ,
+def organizations_finance() -> pd.DataFrame:
+    """ Načte data o financích organizací z databáze zdroje pravdy v Bigquery.
+    Finance jsou v rozdělení po jednotlivých letech.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+        #    FROM `data-poc-424211.ssot.Organizace_finance_ssot`
+    query = """
+           SELECT *
+           FROM `sista-data-stream.ssot.applicants_finances`
+           """
+    df = client.query(query).to_dataframe()
+    return df
+#? DONE, ,
+def results() -> pd.DataFrame:
+    """ Načte data o výsledcích projektů z databáze zdroje pravdy v Bigquery.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+            #    FROM `data-poc-424211.ssot.Vysledky_ssot`
+    query = """
+            SELECT *
+            FROM `sista-data-stream.ssot.results`
+            """
+    df = client.query(query).to_dataframe()
+    return df
+#? DONE, ,
+def cfp() -> pd.DataFrame:
+    """ Načte data o veřejných soutěží z databáze zdroje pravdy v Bigquery.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+            # FROM `data-poc-424211.ssot.Verejne_souteze_ssot`
+    query = """
+            SELECT *
+            FROM `sista-data-stream.ssot.cfp`
+            """
+    df = client.query(query).to_dataframe()
+    return df
+#? DONE, ,
+def programmes() -> pd.DataFrame:
+    """ Načte data o programech z databáze zdroje pravdy v Bigquery.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+            # FROM `data-poc-424211.ssot.Programy_ssot`
+    query = """
+            SELECT *
+            FROM `sista-data-stream.ssot.programmes`
+            """
+    df = client.query(query).to_dataframe()
+    return df
+#?, DONE, , solved: internal_data_ISTA (ask Vojta, protoze nic jako `export_projekty` neni nikde)
+def projects_raw_data() -> pd.DataFrame:
+    """ Načte kompletní zdrojová data o projektech z databáze zdroje pravdy v Bigquery.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+    # query = """
+    #                SELECT *
+    #                FROM `data-poc-424211.ssot_source_tables.Export_projekty`
+    #                """
+    query = """
+            SELECT *
+            FROM `sista-data-stream.internal_data_ISTA.raw_projects`
+            """
+    df = client.query(query).to_dataframe()
+    return df
+#? DONE, , same
+def organizations_raw_data() -> pd.DataFrame:
+    """ Načte kompletní zdrojová data o organizacích z databáze zdroje pravdy v Bigquery.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :return: DataFrame načtených dat ze zdroje
+    """
+    # query = """
+    #         SELECT *
+    #         FROM `data-poc-424211.ssot_source_tables.Export_ucastnici`
+    #         """
+    query = """
+            SELECT *
+            FROM `sista-data-stream.internal_data_ISTA.raw_applicants`
+            """
+    df = client.query(query).to_dataframe()
+    return df
+#TODO: zbyva prepsat `intersects()`
+class Administrovane_projekty:
+    """ Třída, která vypočítává počet administrovaných projektů v určitému časovému úseku.
+    Lze použít pouze v rámci Google Colab prostředí.
+    :param df_hodnoceno_final: DataFrame počtu hodnocených projektů ve zvoleném časovém úseku, agregace podle programu nebo VS
+    :type df_hodnoceno_final: DataFrame
+    :param df_realizace_final: DataFrame počtu realizovaných projektů ve zvoleném časovém úseku, agregace podle programu nebo VS
+    :type df_realizace_final: DataFrame
+    :param df_implementace_final: DataFrame počtu implementovaných projektů ve zvoleném časovém úseku, agregace podle programu nebo VS
+    :type df_implementace_final: DataFrame
+    :param df_administrovan_vse_final: DataFrame počtu administrovaných projektů ve zvoleném časovém úseku, agregace podle programu nebo VS
+    :type df_administrovan_vse_final: DataFrame
+    :param df_administrovan_bez_impl_final: DataFrame počtu administrovaných projektů (bez implementovaných) ve zvoleném časovém úseku, agregace podle programu nebo VS
+    :type df_administrovan_bez_impl_final: DataFrame
+    :param df_pouze_implementace_final: DataFrame počtu pouze implementovaných projektů (vyloučení projektů, které byly ve stejném období v realizaci nebo hodnocené) ve zvoleném časovém úseku, agregace podle programu nebo VS
+    :type df_pouze_implementace_final: DataFrame
+    """
+    pd.set_option("mode.chained_assignment", None)
+    def __init__(self, agg_col: str, start_period: str, end_period: str):
+        """Konstruktor, který vrací potřebné výstupy ve formě dataframe
+        """
+        self.df = self.intersects(start_period, end_period)
+        self.create_output(self.df, agg_col)
+    @staticmethod
+    def intersects(start_period, end_period):
+        """připraví data ze ssot načte projekty a přidá termíny ze souboru VS, upraví formáty dat
+           vyhodnotí, zda byl projekt hodnocen, realizován nebo implementován
+           v případě administrovaných nebo pouze implementovaných projektů započítá každý projekt pouze jednou
+           Lze použít pouze v rámci Google Colab prostředí.
+        :param start_period: začátek intervalu pro výpočet ve formátu 'YYYY-MM-DD'
+        :param end_period: konec intervalu pro výpočet ve formátu 'YYYY-MM-DD'
+        :return: dataframe s novým sloupcem/sloupci s označením fáze ve kterém se projekt během zadaného intervalu nacházel
+        """
+        #! bere uz z nove prepsanych Projects() -> check!!
+        vs_data = cfp()
+        proj_data = Projects().projects
+        proj_data.loc[proj_data["kod_programu"]=="TG", "kod_VS"] = proj_data["kod_projektu"].str[:6]
+        df = pd.merge(proj_data, vs_data[["kod_VS","termin_vyhlaseni_vysledku","ukonceni_soutezni_lhuty"]],on="kod_VS",how="left")
+        date_cols = ["zacatek_reseni", "konec_reseni", "ukonceni_soutezni_lhuty", "termin_vyhlaseni_vysledku"]
+        for col in date_cols:
+            df[col]=pd.to_datetime(df[col], format="%d.%m.%Y", errors="coerce")
+        if start_period is None or end_period is None:
+            raise ValueError("Musíte zadat oba parametry 'start_period' a 'end_period', pokud vybíráte typ 'period'.")
+        try:
+            first_day = pd.to_datetime(start_period)
+            last_day = pd.to_datetime(end_period)
+            first_day_stamp = pd.Timestamp(first_day)
+            impl_start = first_day_stamp - pd.DateOffset(months=48) # bereme fixně, že impelemntace trvá 4 roky po skončení projektu
+            df['hodnocen'] = (df["ukonceni_soutezni_lhuty"]<=last_day) & (df["termin_vyhlaseni_vysledku"]>=first_day) | df["termin_vyhlaseni_vysledku"].isna() # upravoval sem na interval
+            df['realizace'] = (df["zacatek_reseni"]<=last_day) & (df["konec_reseni"]>=first_day) & ~(df["faze_projektu"] =="Nepodpořené")
+            df['implementace'] = (df["konec_reseni"]<last_day) & (df["konec_reseni"] >= impl_start) & ~(df["faze_projektu"] =="Nepodpořené")
+            df['administrovan_vse'] = (df["hodnocen"] == True) | (df["realizace"] == True) | (df["implementace"] == True)
+            df['administrovan_bez_impl'] = (df["hodnocen"] == True) | (df["realizace"] == True)
+            df['pouze_implementace'] = (df["hodnocen"] == False) & (df["realizace"] == False) & (df["implementace"] == True)
+        except ValueError:
+            raise ValueError("Parametry 'start_period' a 'end_period' musí být ve správném formátu 'YYYY-MM-DD'.")
+        if last_day < first_day:
+            raise ValueError("'end_period' nemůže být dříve než 'start_period'.")
+        return df
+    def create_output(self, df:pd.DataFrame, agg_col: str):
+        """vytoří agregovaný souhrn počtu projektů v zadané fázi
+        :param df: určuje fázi, pro kterou chci provést výpočet
+                * hodnoceno - počet hodnocených projektů
+                * realizace - počet realizovancých projektů
+                * implementace - počet implementovaných projektů
+                * administrovan_vse - počet administrovaných projektů
+                * administrovan_bez_impl - počet administroavných projektů bez implementovaných
+                * pouze_implementace - počet implementovaných projektů s vyloučením projektů které byly realizovány nebo hodnoceny
+        :param agg_col: určuje agregaci výpočtu
+                * kod_programu - na úrovni programů
+                * kod_VS - na úrovni VS
+        :return: dataframe s počty projektů v zadané fázi
+        """
+        agg_enable = ['kod_programu', 'kod_VS']
+        if agg_col not in agg_enable:
+            raise ValueError(f"Chyba: Sloupec '{agg_col}' není povolený pro agregaci! Zadejte jeden z těchto sloupců: {agg_enable}")
+        cols_to_process = [
+            'hodnocen',
+            'realizace',
+            'implementace',
+            'administrovan_vse',
+            'administrovan_bez_impl',
+            'pouze_implementace'
+        ]
+        results = {}
+        for col in cols_to_process:
+            df_grouped = df.groupby(agg_col)[col].sum().reset_index()
+            total_count = df_grouped[col].sum()
+            df_final = pd.concat([df_grouped, pd.DataFrame({agg_col: ['Součet'], col: [total_count]})], ignore_index=True)
+            results[col] = df_final
+        self.hodnoceno = results['hodnocen']
+        self.realizace = results['realizace']
+        self.implementace = results['implementace']
+        self.administrovan_vse = results['administrovan_vse']
+        self.administrovan_bez_impl = results['administrovan_bez_impl']
+        self.pouze_implementace = results['pouze_implementace']
+def _get_VOPO_kod(typ, list_item):
+    """Pomocná funkce pro získání typu organizace. Respektive se jedná o agregaci původní typologie do nové"""
+    if typ in list_item:
+        return 'PO'
+    elif typ == 'VO':
+        return 'VO'
+    else:
+        return 'O'
+#? DONE, ,
+def podporene_VOPO(from_date, to_date, typ_agg, show_projects=False):
+    """Funkce, která spočítá počet podpořených organizací (unikátně podle IČO) po programech v zadaném roce.
+    Organizace jsou dělené na VO - výzkumné organizace a PO - podniky, příp. O - ostatní.
+    Používá se do tabulek ve VZ a zprávě pro KR.
+    Použití v Google prostředí.
+    :param from_date: datum začátku intervalu, za který chceme podpořené organizace spočítat, ve formátu 'YYYY-MM-DD'
+    :param to_date: datum konce intervalu, za který chceme podpořené organizace spočítat, ve formátu 'YYYY-MM-DD'
+    :param typ_agg: typ agregace, 'celkem' počítá účasti nebo 'unikatni' počítá unikátní IČA
+    :param show_projects: volitelný parametr, pokud je True, vrací seznam projektů za dané období
+    :return: dataframe s počtem podpořených organizací po porogramech rozděleno na VO, PO a ostatní
+    """
+    try:
+      from_date = pd.to_datetime(from_date)
+      to_date = pd.to_datetime(to_date)
+    except ValueError:
+      raise ValueError("Parametry 'from_date' a 'to_date' musí být ve správném formátu 'YYYY-MM-DD'.")
+    if from_date > to_date:
+      raise ValueError("Začátek intervalu (from_date) nesmí být později než konec intervalu (to_date).")
+    org_podp = Organizations().select_funded().organizations
+    projects_podp=Projects().select_funded().projects
+    # org_podp_terminy=pd.merge(org_podp, projects_podp, left_on='kod_projektu', right_on='kod_projektu')
+    org_podp_terminy=pd.merge(org_podp, projects_podp, left_on='project_code', right_on='project_code')
+    PO_list = ['MP', 'SP', 'VP', 'UP']
+    org_podp_terminy['VOPO_kod'] = org_podp_terminy['typeorg_kod'].apply(lambda typ: _get_VOPO_kod(typ, PO_list)) #? `typeorg` by mel byt zdefinovany z `_data_preparing()`
+    # v `VOPO_KOD` je tedy ulozeno 'PO', 'VO', 'O'
+    # filtered_df = org_podp_terminy[(org_podp_terminy['konec_reseni'] >= from_date) & (org_podp_terminy['zacatek_reseni'] <= to_date)]
+    filtered_df = org_podp_terminy[(org_podp_terminy['implementation_end'] >= from_date) & (org_podp_terminy['implementation_start'] <= to_date)]
+    if typ_agg == 'celkem':
+        # org_prog_typ = filtered_df.groupby(['kod_program', 'VOPO_kod']).agg({'ICO_organizace': 'count'}).reset_index()
+        org_prog_typ = filtered_df.groupby(['programme_code', 'VOPO_kod']).agg({'id_number': 'count'}).reset_index()
+    elif typ_agg == 'unikatni':
+        # org_prog_typ = filtered_df.groupby(['kod_program', 'VOPO_kod']).agg({'ICO_organizace': 'nunique'}).reset_index()
+        org_prog_typ = filtered_df.groupby(['programme_code', 'VOPO_kod']).agg({'id_number': 'nunique'}).reset_index()
+    else:
+        raise ValueError(f'Neznámý typ agregace {typ_agg}, platné typy jsou \'celkem\' a \'unikatni\'')
+    org_prog_typ_pivot = org_prog_typ.pivot(
+        # index='kod_program', columns='VOPO_kod', values="ICO_organizace"
+        index='programme_code', columns='VOPO_kod', values="id_number"
+    )
+    org_prog_typ_pivot = org_prog_typ_pivot.fillna(0)
+    org_prog_typ_pivot = org_prog_typ_pivot.astype(int)
+    org_prog_typ_pivot = org_prog_typ_pivot[['VO', 'PO','O']]
+    period_str = f"{from_date.strftime('%Y-%m-%d')} - {to_date.strftime('%Y-%m-%d')}"
+    new_names = {'PO': f"Počet podpořených podniků v období {period_str}",'VO': f"Počet podpořených VO v období {period_str}: ",'O': f"Počet podpořených ostatních v období {period_str}: "}
+    org_prog_typ_pivot.rename(columns=new_names, inplace=True)
+    org_prog_typ_pivot.loc['Celkem'] = org_prog_typ_pivot.sum(numeric_only=True)
+    if show_projects:
+        ### kdybychom to chteli tridit dle programu, coz ale Michal tvrdi, ze spis nechceme: ###
+        # projects_list = filtered_df.groupby('kod_program')['kod_projektu'].apply(lambda x: x.unique().tolist()).reset_index()
+        # projects_list.rename(columns={'kod_projektu': 'list_of_projects'}, inplace=True)
+        # print(projects_list)
+        # projects_list.to_excel('projects_list.xlsx', index=False)
+        # print(f"\nSeznam projektu ke kazdemu programu byl ulozen do souboru 'projects_list.xlsx'.\n")
+        # unique_projects_df = filtered_df[['kod_projektu']].drop_duplicates().reset_index(drop=True)
+        unique_projects_df = filtered_df[['project_code']].drop_duplicates().reset_index(drop=True)
+        # unique_projects_df.rename(columns={'kod_projektu': 'Seznam unikátních projektů'}, inplace=True)
+        unique_projects_df.rename(columns={'project_code': 'Seznam unikátních projektů'}, inplace=True)
+        print(unique_projects_df)
+        unique_projects_df.to_excel('unique_projects.xlsx', index=False)
+        print(f"\nSeznam unikátních projektů byl uložen do souboru 'unique_projects.xlsx'.\n")
+    return org_prog_typ_pivot
+#! project_state = faze_projektu
+#! project_substate = stav_projektu