PyPI - sklinearstats - Versions diffs - 0.1.5__tar.gz - Mend

sklinearstats 0.1.5__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

sklinearstats-0.1.5/PKG-INFO +11 -0
sklinearstats-0.1.5/README.md +3 -0
sklinearstats-0.1.5/pyproject.toml +17 -0
sklinearstats-0.1.5/setup.cfg +4 -0
sklinearstats-0.1.5/sklinear/__init__.py +1 -0
sklinearstats-0.1.5/sklinear/printer.py +476 -0
sklinearstats-0.1.5/sklinearstats.egg-info/PKG-INFO +11 -0
sklinearstats-0.1.5/sklinearstats.egg-info/SOURCES.txt +8 -0
sklinearstats-0.1.5/sklinearstats.egg-info/dependency_links.txt +1 -0
sklinearstats-0.1.5/sklinearstats.egg-info/top_level.txt +2 -0

sklinearstats-0.1.5/PKG-INFO ADDED Viewed

@@ -0,0 +1,11 @@
+Metadata-Version: 2.4
+Name: sklinearstats
+Version: 0.1.5
+Summary: Numpy extended helper libraries
+Author: regen
+Requires-Python: >=3.8
+Description-Content-Type: text/markdown
+# codeprinter
+Prints stored code when imported.

sklinearstats-0.1.5/README.md ADDED Viewed

@@ -0,0 +1,3 @@
+# codeprinter
+Prints stored code when imported.

sklinearstats-0.1.5/pyproject.toml ADDED Viewed

@@ -0,0 +1,17 @@
+[build-system]
+requires = ["setuptools>=61.0"]
+build-backend = "setuptools.build_meta"
+[project]
+name = "sklinearstats"
+version = "0.1.5"
+description = "Numpy extended helper libraries"
+readme = "README.md"
+requires-python = ">=3.8"
+authors = [
+    {name = "regen"}
+]
+[tool.setuptools.packages.find]
+where = ["."]

sklinearstats-0.1.5/setup.cfg ADDED Viewed

@@ -0,0 +1,4 @@
+[egg_info]
+tag_build =
+tag_date = 0

sklinearstats-0.1.5/sklinear/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ from .printer import show

sklinearstats-0.1.5/sklinear/printer.py ADDED Viewed

@@ -0,0 +1,476 @@
+def show():
+    content = r'''
+<class 'pandas.core.frame.DataFrame'>
+              precision    recall  f1-score   support
+           0       0.72      0.86      0.79       159
+           1       0.72      0.52      0.60       108
+    accuracy                           0.72       267
+   macro avg       0.72      0.69      0.69       267
+weighted avg       0.72      0.72      0.71       267
+RangeIndex: 5 entries, 0 to 4
+Data columns (total 6 columns):
+ #   Column             Non-Null Count  Dtype
+---  ------             --------------  -----
+ 0   First Name         5 non-null      object
+ 1   Gender             5 non-null      object
+ 2   Salary             4 non-null      float64
+ 3   Bonus %            4 non-null      float64
+ 4   Senior Management  5 non-null      bool
+ 5   Team               4 non-null      object
+dtypes: bool(1), float64(2), object(3)
+memory usage: 337.0+ bytes
+Input: [0 0], Predicted: [0], Expected: 0
+Input: [0 1], Predicted: [1], Expected: 1
+Input: [1 0], Predicted: [1], Expected: 1
+Input: [1 1], Predicted: [1], Expected: 1
+=========================================================================
+#PRACTICAL NO: 13
+#Implementation of Boosting Algorithms: AdaBoost, Stochastic Gradient Boosting, Voting Ensemble
+=========================================================================
+#========================================================================
+# Adaboost
+#========================================================================
+import pandas as pd
+from sklearn.ensemble import AdaBoostClassifier
+from sklearn.model_selection import KFold, cross_val_score
+df = pd.read_csv("diabetes.csv")
+X,y = df.iloc[:,:8], df.iloc[:,8]
+score = cross_val_score(
+    AdaBoostClassifier(n_estimators=30,random_state=42),
+    X,y,
+    cv=KFold(10,shuffle=True,random_state=42)
+)
+print(score.mean())
+#Gradient Boosting
+import pandas as pd
+from sklearn.ensemble import GradientBoostingClassifier
+from sklearn.model_selection import KFold, cross_val_score
+df = pd.read_csv("diabetes.csv")
+X,y = df.iloc[:,:8], df.iloc[:,8]
+score = cross_val_score(
+    GradientBoostingClassifier(n_estimators=30,random_state=42),
+    X,y,
+    cv=KFold(10,shuffle=True,random_state=42)
+)
+print(score.mean())
+#========================================================================
+# Random Forest(Pract 12)
+#========================================================================
+import pandas as pd
+from sklearn.preprocessing import LabelEncoder
+from sklearn.ensemble import RandomForestClassifier
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import classification_report
+df = pd.read_csv("PlayGolf.csv")
+for c in df.columns:
+    df[c] = LabelEncoder().fit_transform(df[c])
+X = df.drop('play',axis=1)
+y = df['play']
+X_train,X_test,y_train,y_test = train_test_split(
+    X,y,test_size=0.2,random_state=42
+)
+model = RandomForestClassifier(5)
+model.fit(X_train,y_train)
+print(classification_report(y_test,model.predict(X_test)))
+print(model.predict([[1,1,0,0]]))
+#plotting
+from sklearn.tree import plot_tree
+import matplotlib.pyplot as plt
+plot_tree(model.estimators_[0],filled=True)
+plt.show()
+#========================================================================
+# k means clustering practical 11
+#========================================================================
+import pandas as pd
+import matplotlib.pyplot as plt
+from sklearn.cluster import KMeans
+df = pd.read_csv("Countryclusters.csv")
+df["Language"] = df["Language"].map({
+    'English':1,'Hindi':2,'French':3,'German':4,'Japanese':5
+})
+X = df.iloc[:,1:4]
+wcss = [KMeans(i,n_init=10).fit(X).inertia_ for i in range(1,7)]
+plt.plot(range(1,7),wcss)
+plt.show()
+cluster = KMeans(n_clusters=4,n_init=10).fit_predict(X)
+plt.scatter(df["Longitude"],df["Latitude"],c=cluster,cmap='turbo',s=200)
+plt.show()
+#========================================================================
+# Support Vector Machine practical 10
+#========================================================================
+import pandas as pd, seaborn as sns, matplotlib.pyplot as plt
+from sklearn.model_selection import train_test_split
+from sklearn.preprocessing import StandardScaler
+from sklearn.svm import SVC
+from sklearn.metrics import *
+df = pd.read_csv("Bank_Customer_retirement.csv")
+sns.pairplot(df,hue='Retire',vars=['Age','401K Savings'])
+plt.show()
+X = StandardScaler().fit_transform(df[['Age','401K Savings']])
+y = df['Retire']
+X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=0)
+pred = SVC(kernel='poly').fit(X_train,y_train).predict(X_test)
+print("Accuracy:",accuracy_score(y_test,pred))
+print(classification_report(y_test,pred))
+sns.heatmap(confusion_matrix(y_test,pred),annot=True)
+plt.show()
+#========================================================================
+# logistic regression practical 9
+#========================================================================
+import pandas as pd
+from sklearn.model_selection import train_test_split
+from sklearn.linear_model import LogisticRegression
+from sklearn.metrics import *
+df = pd.read_csv('/content/titanic.csv').dropna().drop(['Sex','Name'], axis=1)
+X_train,X_test,y_train,y_test = train_test_split(
+    df.drop('Survived', axis=1), df['Survived'],
+    test_size=0.3, random_state=101
+)
+pred = LogisticRegression().fit(X_train,y_train).predict(X_test)
+ConfusionMatrixDisplay.from_predictions(y_test,pred)
+print(classification_report(y_test,pred))
+#========================================================================
+# feature selection practical 8
+#========================================================================
+import pandas as pd
+from sklearn.feature_selection import *
+df = pd.read_csv("train_mobile.csv")
+X,y = df.iloc[:,:20], df.iloc[:,-1]
+print(pd.concat([
+    pd.DataFrame(X.columns),
+    pd.DataFrame(SelectKBest(chi2,k=10).fit(X,y).scores_)
+],axis=1))
+# standardization and normalization
+import pandas as pd
+from sklearn.preprocessing import *
+df = pd.read_csv("Loan_Data (1).csv")[['loan_amount','interest_rate','installment']]
+print(df.head())
+print(StandardScaler().fit_transform(df))
+print(MinMaxScaler().fit_transform(df))
+#========================================================================
+# PCA
+#========================================================================
+import pandas as pd
+from sklearn.model_selection import train_test_split
+from sklearn.preprocessing import StandardScaler
+from sklearn.decomposition import PCA
+from sklearn.linear_model import LogisticRegression
+from sklearn.metrics import accuracy_score
+df = pd.read_csv("wine.data.csv")
+X_train,X_test,y_train,y_test = train_test_split(
+    df.iloc[:,:13], df.iloc[:,0],
+    test_size=0.2, random_state=0
+)
+X_train = StandardScaler().fit_transform(X_train)
+X_test = StandardScaler().fit(X_test).transform(X_test)
+X_train = PCA(1).fit_transform(X_train)
+X_test = PCA(1).fit_transform(X_test)
+pred = LogisticRegression().fit(X_train,y_train).predict(X_test)
+print("Accuracy:",accuracy_score(y_test,pred))
+#========================================================================
+# Adaline algorithm for AND operation practical 7
+#========================================================================
+import numpy as np
+X=np.array([[0,0],[0,1],[1,0],[1,1]])
+y=np.array([0,0,0,1])
+w=np.zeros(2)
+b=0
+lr=0.1
+for _ in range(100):
+    for i in range(4):
+        out=np.dot(X[i],w)+b
+        e=y[i]-out
+        w+=lr*e*X[i]
+        b+=lr*e
+for i in range(4):
+    p=1 if np.dot(X[i],w)+b>=0.5 else 0
+    print(f"Input: {X[i]} => Predicted: {p} => Actual: {y[i]}")
+#========================================================================
+# Improve the prediction accuracy by estimating the weight values for the # training data using stochastic gradient descent.
+(Perceptron). Practical 6
+#========================================================================
+X=[[0,0],[0,1],[1,0],[1,1]]
+y=[0,0,0,1]
+w1=w2=b=0
+lr=0.1
+for _ in range(10):
+    for i in range(4):
+        x1,x2=X[i]
+        p=1 if w1*x1+w2*x2+b>=0 else 0
+        e=y[i]-p
+        w1+=lr*e*x1
+        w2+=lr*e*x2
+        b+=lr*e
+print("Weights:",w1,w2)
+print("Bias:",b)
+for x1,x2 in X:
+    p=1 if w1*x1+w2*x2+b>=0 else 0
+    print([x1,x2],"->",p)
+#========================================================================
+# Implement Perceptron algorithm for OR operation.practical 5
+#========================================================================
+import numpy as np
+X=np.array([[0,0],[0,1],[1,0],[1,1]])
+y=np.array([0,1,1,1])
+w=np.zeros(2)
+b=0
+lr=0.1
+for _ in range(10):
+    for i in range(4):
+        p=1 if np.dot(X[i],w)+b>=0 else 0
+        e=y[i]-p
+        w+=lr*e*X[i]
+        b+=lr*e
+for i in range(4):
+    p=1 if np.dot(X[i],w)+b>=0 else 0
+    print(f"Input: {X[i]}, Predicted: [{p}], Expected: {y[i]}")
+#========================================================================
+# practical 4
+# NUMPY FUNCTIONS
+# execute on single code
+#========================================================================
+import numpy as np
+np.zeros(10)
+np.ones(10)
+np.arange(10,51)
+np.eye(3)
+np.linspace(0,1,20)
+#========================================================================
+# MATRIX OPERATIONS
+#========================================================================
+mat = np.arange(1,26).reshape(5,5)
+mat.sum()
+mat.std()
+mat.sum(axis=0)
+mat.sum(axis=1)
+#========================================================================
+# PANDAS DATAFRAME CREATION
+#========================================================================
+import pandas as pd
+df = pd.DataFrame({
+    'Name':['Tom','Jack'],
+    'Age':[20,25],
+    'city':['New York','London'] # Added 'city' column for demonstration
+})
+#========================================================================
+# MISSING VALUE HANDLING
+#========================================================================
+df.isnull()
+df.fillna(75)
+#========================================================================
+# GROUPBY OPERATIONS
+#========================================================================
+df.groupby('city')['Age'].mean() # Explicitly calculating mean for 'Age'
+df.groupby('city').sum()
+df.groupby('city').count()
+#========================================================================
+# CSV FILE OPERATIONS
+#========================================================================
+empdf = pd.read_csv("employee.csv")
+empdf.head()
+empdf.tail()
+empdf.info()
+empdf.describe()
+#========================================================================
+# DATA CLEANING
+#========================================================================
+empdf.drop_duplicates()
+empdf.rename({'Team':'Department'}, axis=1)
+empdf.ffill()
+#========================================================================
+# PROLOG
+#========================================================================
+#========================================================================
+# DFS Water Jug Problem
+#========================================================================
+start((0,0)).
+goal((2,0)).
+move((X,Y),(5,Y)):-X<5.
+move((X,Y),(X,4)):-Y<4.
+move((X,Y),(0,Y)):-X>0.
+move((X,Y),(X,0)):-Y>0.
+move((X,Y),(NX,NY)):-
+ X>0,Y<4,
+ T is min(X,4-Y),
+ NX is X-T,
+ NY is Y+T.
+move((X,Y),(NX,NY)):-
+ Y>0,X<5,
+ T is min(Y,5-X),
+ NX is X+T,
+ NY is Y-T.
+#========================================================================
+# Tic Tac Toe
+#========================================================================
+show([A,B,C,D,E,F,G,H,I]):-
+ write(A),write(' '),write(B),write(' '),write(C),nl,
+ write(D),write(' '),write(E),write(' '),write(F),nl,
+ write(G),write(' '),write(H),write(' '),write(I),nl.
+put(Board,Pos,Val,NewBoard):-
+ nth1(Pos,Board,_,Rest),
+ nth1(Pos,NewBoard,Val,Rest).
+win([P,P,P,_,_,_,_,_,_],P).
+win([_,_,_,P,P,P,_,_,_],P).
+win([_,_,_,_,_,_,P,P,P],P).
+win([P,_,_,P,_,_,P,_,_],P).
+win([_,P,_,_,P,_,_,P,_],P).
+win([_,_,P,_,_,P,_,_,P],P).
+win([P,_,_,_,P,_,_,_,P],P).
+win([_,_,P,_,P,_,P,_,_],P).
+play :-
+ B=[_,_,_,_,_,_,_,_,_],
+ show(B),
+ read(P1),put(B,P1,x,B1),
+ read(P2),put(B1,P2,o,B2),
+ read(P3),put(B2,P3,x,B3),
+ read(P4),put(B3,P4,o,B4),
+ read(P5),put(B4,P5,x,B5),
+ (win(B5,W)->write(W),write(' wins!');write('No winner')).
+#========================================================================
+# 8 Puzzle Hill Climbing
+#========================================================================
+start(1/2/3/4/8/0/7/6/5).
+goal(1/2/3/4/5/6/7/8/0).
+move(1/2/3/4/8/0/7/6/5,1/2/3/4/8/5/7/6/0).
+move(1/2/3/4/8/5/7/6/0,1/2/3/4/8/5/7/0/6).
+move(1/2/3/4/8/5/7/0/6,1/2/3/4/0/5/7/8/6).
+move(1/2/3/4/0/5/7/8/6,1/2/3/4/5/0/7/8/6).
+move(1/2/3/4/5/0/7/8/6,1/2/3/4/5/6/7/8/0).
+solve :-
+ start(S),
+ move(S,A),
+ move(A,B),
+ move(B,C),
+ move(C,D),
+ move(D,G),
+ goal(G),
+ write('Goal Reached! Total Cost = 5').
+'''
+    print(content)

sklinearstats-0.1.5/sklinearstats.egg-info/PKG-INFO ADDED Viewed

@@ -0,0 +1,11 @@
+Metadata-Version: 2.4
+Name: sklinearstats
+Version: 0.1.5
+Summary: Numpy extended helper libraries
+Author: regen
+Requires-Python: >=3.8
+Description-Content-Type: text/markdown
+# codeprinter
+Prints stored code when imported.

sklinearstats-0.1.5/sklinearstats.egg-info/SOURCES.txt ADDED Viewed

@@ -0,0 +1,8 @@
+README.md
+pyproject.toml
+sklinear/__init__.py
+sklinear/printer.py
+sklinearstats.egg-info/PKG-INFO
+sklinearstats.egg-info/SOURCES.txt
+sklinearstats.egg-info/dependency_links.txt
+sklinearstats.egg-info/top_level.txt

sklinearstats-0.1.5/sklinearstats.egg-info/dependency_links.txt ADDED Viewed

	@@ -0,0 +1 @@
1	+

sklinearstats-0.1.5/sklinearstats.egg-info/top_level.txt ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ dist
2	+ sklinear