PyPI - TopDownHockey-Scraper - Versions diffs - 3.2.1__tar.gz → 3.2.3__tar.gz - Mend

TopDownHockey-Scraper 3.2.1tar.gz → 3.2.3tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of TopDownHockey-Scraper might be problematic. Click here for more details.

Files changed (13) hide show

{topdownhockey_scraper-3.2.1/src/TopDownHockey_Scraper.egg-info → topdownhockey_scraper-3.2.3}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: TopDownHockey_Scraper
-Version: 3.2.1
+Version: 3.2.3
 Summary: The TopDownHockey Scraper
 Home-page: https://github.com/TopDownHockey/TopDownHockey_Scraper
 Author: Patrick Bacon

{topdownhockey_scraper-3.2.1 → topdownhockey_scraper-3.2.3}/setup.cfg RENAMED Viewed

@@ -1,6 +1,6 @@
 [metadata]
 name = TopDownHockey_Scraper
-version = 3.2.1
+version = 3.2.3
 author = Patrick Bacon
 author_email = patrick.s.bacon@gmail.com
 description = A package built for scraping hockey data from EliteProspects, the NHL's HTML/API reports, and ESPN's XML reports.

{topdownhockey_scraper-3.2.1 → topdownhockey_scraper-3.2.3}/setup.py RENAMED Viewed

@@ -9,7 +9,7 @@ with open("README.md", "r", encoding="utf-8") as fh:
 setup(
     name="TopDownHockey_Scraper", # Replace with your own username
-    version="3.2.1",
+    version="3.2.3",
     author="Patrick Bacon",
     author_email="patrick.s.bacon@gmail.com",
     description="The TopDownHockey Scraper",

{topdownhockey_scraper-3.2.1 → topdownhockey_scraper-3.2.3}/src/TopDownHockey_Scraper/TopDownHockey_NHL_Scraper.py RENAMED Viewed

@@ -1687,7 +1687,9 @@ def scrape_espn_events(espn_game_id, drop_description = True):
     clock_df = clock_df[~pd.isna(clock_df.clock)]
-    coords_df = pd.DataFrame(json.loads(str(soup).split('plays":')[1].split(',"st":1')[0].split(',"st":2')[0]))
+    # Needed to add .split(',"st":3')[0] for playoffs
+    coords_df = pd.DataFrame(json.loads(str(soup).split('plays":')[1].split(',"st":1')[0].split(',"st":2')[0].split(',"st":3')[0]))
     clock_df = clock_df.assign(
         clock = clock_df.clock.apply(lambda x: x['displayValue'])
@@ -1870,6 +1872,7 @@ def scrape_espn_events(espn_game_id, drop_description = True):
         return espn_events
 def scrape_espn_ids_single_game(game_date, home_team, away_team):
     gamedays = pd.DataFrame()
     if home_team == 'ATLANTA THRASHERS':
@@ -1894,33 +1897,29 @@ def scrape_espn_ids_single_game(game_date, home_team, away_team):
     gids = []
     fax = pd.DataFrame()
     #print(str(i))
-    for i in range (0, (int(len(soup_found)/3))):
-        away = soup_found[0 + (i * 3)]['href'].rsplit('/')[-2].upper()
-        home = soup_found[1 + (i * 3)]['href'].rsplit('/')[-2].upper()
-        espnid = soup_found[2 + (i * 3)]['href'].split('gameId/', 1)[1]
+    for i in range (0, ((len(soup_found)))):
+        away = soup_found[i]['href'].rsplit('/')[-1].split('-')[0].upper()
+        home = soup_found[i]['href'].rsplit('/')[-1].split('-')[1].upper()
+        espnid = soup_found[i]['href'].rsplit('/')[-2]
         at.append(away)
         ht.append(home)
         gids.append(espnid)
     fax = fax.assign(
     away_team = at,
     home_team = ht,
     espn_id = gids,
     game_date = pd.to_datetime(this_date))
     gamedays = gamedays._append(fax)
     gamedays = gamedays.assign(
         home_team = np.where(gamedays.home_team=='ST LOUIS BLUES', 'ST. LOUIS BLUES', gamedays.home_team),
         away_team = np.where(gamedays.away_team=='ST LOUIS BLUES', 'ST. LOUIS BLUES', gamedays.away_team),
         espn_id = gamedays.espn_id.str.split('/').str[0].astype(int)
     )
-    #gamedays = gamedays.assign(
-     #   home_team = np.where(gamedays.home_team=='WINNIPEG JETS', 'ATLANTA THRASHERS', gamedays.home_team),
-      #  away_team = np.where(gamedays.away_team=='WINNIPEG JETS', 'ATLANTA THRASHERS', gamedays.away_team),
-       # espn_id = gamedays.espn_id.astype(int))
     gamedays = gamedays.assign(
         home_team = np.where(gamedays.home_team=='TB', 'TBL',
                     np.where(gamedays.home_team=='T.B', 'TBL',
@@ -1942,7 +1941,9 @@ def scrape_espn_ids_single_game(game_date, home_team, away_team):
                     gamedays.away_team)))))))),
         espn_id = gamedays.espn_id.astype(int))
-    gamedays = gamedays[(gamedays.game_date==this_date) & (gamedays.home_team==home_team) & (gamedays.away_team==away_team)]
+    # Might need to fix later; don't have right home/away teams right now
+    #gamedays = gamedays[(gamedays.game_date==this_date) & (gamedays.home_team==home_team) & (gamedays.away_team==away_team)]
     return(gamedays)

{topdownhockey_scraper-3.2.1 → topdownhockey_scraper-3.2.3/src/TopDownHockey_Scraper.egg-info}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: TopDownHockey_Scraper
-Version: 3.2.1
+Version: 3.2.3
 Summary: The TopDownHockey Scraper
 Home-page: https://github.com/TopDownHockey/TopDownHockey_Scraper
 Author: Patrick Bacon