PyPI - sqlframe - Versions diffs - 1.12.0__py3-none-any.whl → 1.14.0__py3-none-any.whl - Mend

sqlframe 1.12.0py3-none-any.whl → 1.14.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

sqlframe/_version.py +2 -2
sqlframe/base/function_alternatives.py +115 -10
sqlframe/base/functions.py +49 -23
sqlframe/base/session.py +4 -1
sqlframe/base/util.py +28 -1
sqlframe/bigquery/functions.py +13 -17
sqlframe/bigquery/functions.pyi +0 -1
sqlframe/bigquery/session.py +0 -1
sqlframe/duckdb/functions.py +4 -1
sqlframe/duckdb/session.py +0 -2
sqlframe/postgres/functions.py +3 -0
sqlframe/postgres/session.py +8 -2
sqlframe/snowflake/functions.py +2 -0
sqlframe/snowflake/functions.pyi +0 -1
sqlframe/snowflake/session.py +0 -2
sqlframe/spark/functions.py +1 -0
{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/METADATA +3 -3
{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/RECORD +21 -21
{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/LICENSE +0 -0
{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/WHEEL +0 -0
{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/top_level.txt +0 -0

sqlframe/_version.py CHANGED Viewed

@@ -12,5 +12,5 @@ __version__: str
 __version_tuple__: VERSION_TUPLE
 version_tuple: VERSION_TUPLE
-__version__ = version = '1.12.0'
-__version_tuple__ = version_tuple = (1, 12, 0)
+__version__ = version = '1.14.0'
+__version_tuple__ = version_tuple = (1, 14, 0)

sqlframe/base/function_alternatives.py CHANGED Viewed

@@ -6,11 +6,16 @@ import re
 import typing as t
 from sqlglot import exp as expression
+from sqlglot.dialects.dialect import build_formatted_time
 from sqlglot.helper import ensure_list
 from sqlglot.helper import flatten as _flatten
 from sqlframe.base.column import Column
-from sqlframe.base.util import get_func_from_session
+from sqlframe.base.util import (
+    format_time_from_spark,
+    get_func_from_session,
+    spark_default_time_format,
+)
 if t.TYPE_CHECKING:
     from sqlframe.base._typing import ColumnOrLiteral, ColumnOrName
@@ -556,6 +561,14 @@ def to_date_from_timestamp(col: ColumnOrName, format: t.Optional[str] = None) ->
     return to_date(to_timestamp(col, format))
+def to_date_time_format(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
+    from sqlframe.base.functions import to_date
+    lit = get_func_from_session("lit")
+    format = lit(format or spark_default_time_format())
+    return to_date(col, format=format)
 def last_day_with_cast(col: ColumnOrName) -> Column:
     from sqlframe.base.functions import last_day
@@ -715,14 +728,10 @@ def months_between_cast_as_date_cast_roundoff(
 def from_unixtime_from_timestamp(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
-    from sqlframe.base.session import _BaseSession
-    session: _BaseSession = _BaseSession()
     lit = get_func_from_session("lit")
     col_func = get_func_from_session("col")
-    if format is None:
-        format = session.DEFAULT_TIME_FORMAT
+    format = lit(format or spark_default_time_format())
     return Column.invoke_expression_over_column(
         Column(
             expression.Anonymous(
@@ -731,7 +740,7 @@ def from_unixtime_from_timestamp(col: ColumnOrName, format: t.Optional[str] = No
             )
         ),
         expression.TimeToStr,
-        format=lit(format),
+        format=format_time_from_spark(format),  # type: ignore
     )
@@ -1511,10 +1520,106 @@ def to_unix_timestamp_include_default_format(
     format: t.Optional[ColumnOrName] = None,
 ) -> Column:
     from sqlframe.base.functions import to_unix_timestamp
+    from sqlframe.base.session import _BaseSession
+    if not format:
+        format = _BaseSession().output_dialect.TIME_FORMAT
+    else:
+        format = format_time_from_spark(format)
+    return to_unix_timestamp(timestamp, format)
+def array_append_list_append(col: ColumnOrName, value: ColumnOrLiteral) -> Column:
+    lit = get_func_from_session("lit")
+    value = value if isinstance(value, Column) else lit(value)
+    return Column.invoke_anonymous_function(col, "LIST_APPEND", value)
+def array_append_using_array_cat(col: ColumnOrName, value: ColumnOrLiteral) -> Column:
     lit = get_func_from_session("lit")
+    array = get_func_from_session("array")
+    value = value if isinstance(value, Column) else lit(value)
+    return Column.invoke_anonymous_function(col, "ARRAY_CONCAT", array(value))
-    if not format:
-        format = lit("%Y-%m-%d %H:%M:%S")
-    return to_unix_timestamp(timestamp, format)
+def day_with_try_to_timestamp(col: ColumnOrName) -> Column:
+    from sqlframe.base.functions import day
+    try_to_timestamp = get_func_from_session("try_to_timestamp")
+    to_date = get_func_from_session("to_date")
+    when = get_func_from_session("when")
+    _is_string = get_func_from_session("_is_string")
+    coalesce = get_func_from_session("coalesce")
+    return day(
+        when(
+            _is_string(col),
+            coalesce(try_to_timestamp(col), to_date(col)),
+        ).otherwise(col)
+    )
+def try_to_timestamp_strptime(col: ColumnOrName, format: t.Optional[ColumnOrName] = None) -> Column:
+    lit = get_func_from_session("lit")
+    format = lit(format or spark_default_time_format())
+    return Column.invoke_anonymous_function(col, "TRY_STRPTIME", format_time_from_spark(format))  # type: ignore
+def try_to_timestamp_safe(col: ColumnOrName, format: t.Optional[ColumnOrName] = None) -> Column:
+    lit = get_func_from_session("lit")
+    format = lit(format or spark_default_time_format())
+    return Column.invoke_anonymous_function(
+        format_time_from_spark(format),  # type: ignore
+        "SAFE.PARSE_TIMESTAMP",
+        col,  # type: ignore
+    )
+def try_to_timestamp_pgtemp(col: ColumnOrName, format: t.Optional[ColumnOrName] = None) -> Column:
+    lit = get_func_from_session("lit")
+    format = lit(format or spark_default_time_format())
+    return Column.invoke_anonymous_function(
+        col,
+        "pg_temp.TRY_TO_TIMESTAMP",
+        format_time_from_spark(format),  # type: ignore
+    )
+def typeof_pg_typeof(col: ColumnOrName) -> Column:
+    return Column.invoke_anonymous_function(col, "pg_typeof").cast("regtype").cast("text")
+def typeof_from_variant(col: ColumnOrName) -> Column:
+    col = Column.invoke_anonymous_function(col, "TO_VARIANT")
+    return Column.invoke_anonymous_function(col, "TYPEOF")
+def _is_string_using_typeof_varchar(col: ColumnOrName) -> Column:
+    typeof = get_func_from_session("typeof")
+    lit = get_func_from_session("lit")
+    return lit(typeof(col) == lit("VARCHAR"))
+def _is_string_using_typeof_char_varying(col: ColumnOrName) -> Column:
+    typeof = get_func_from_session("typeof")
+    lit = get_func_from_session("lit")
+    return lit(
+        (typeof(col) == lit("text"))
+        | (typeof(col) == lit("character varying"))
+        | (typeof(col) == lit("unknown"))
+        | (typeof(col) == lit("text"))
+    )
+def _is_string_using_typeof_string(col: ColumnOrName) -> Column:
+    typeof = get_func_from_session("typeof")
+    lit = get_func_from_session("lit")
+    return lit(typeof(col) == lit("STRING"))
+def _is_string_using_typeof_string_lcase(col: ColumnOrName) -> Column:
+    typeof = get_func_from_session("typeof")
+    lit = get_func_from_session("lit")
+    return lit(typeof(col) == lit("string"))

sqlframe/base/functions.py CHANGED Viewed

@@ -6,12 +6,19 @@ import decimal
 import logging
 import typing as t
+from sqlglot import Dialect
 from sqlglot import exp as expression
 from sqlglot.helper import ensure_list
 from sqlglot.helper import flatten as _flatten
 from sqlframe.base.column import Column
 from sqlframe.base.decorators import func_metadata as meta
+from sqlframe.base.util import (
+    format_time_from_spark,
+    get_func_from_session,
+    spark_default_date_format,
+    spark_default_time_format,
+)
 if t.TYPE_CHECKING:
     from pyspark.sql.session import SparkContext
@@ -695,7 +702,7 @@ def date_format(col: ColumnOrName, format: str) -> Column:
     return Column.invoke_expression_over_column(
         Column(expression.TimeStrToTime(this=Column.ensure_col(col).expression)),
         expression.TimeToStr,
-        format=lit(format),
+        format=format_time_from_spark(format),
     )
@@ -875,17 +882,21 @@ def months_between(
 @meta()
 def to_date(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
+    format = lit(format or spark_default_date_format())
     if format is not None:
         return Column.invoke_expression_over_column(
-            col, expression.TsOrDsToDate, format=lit(format)
+            col, expression.TsOrDsToDate, format=format_time_from_spark(format)
         )
     return Column.invoke_expression_over_column(col, expression.TsOrDsToDate)
 @meta()
 def to_timestamp(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
+    format = lit(format or spark_default_time_format())
     if format is not None:
-        return Column.invoke_expression_over_column(col, expression.StrToTime, format=lit(format))
+        return Column.invoke_expression_over_column(
+            col, expression.StrToTime, format=format_time_from_spark(format)
+        )
     return Column.ensure_col(col).cast("timestamp")
@@ -916,23 +927,23 @@ def last_day(col: ColumnOrName) -> Column:
 @meta()
 def from_unixtime(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
-    from sqlframe.base.session import _BaseSession
-    if format is None:
-        format = _BaseSession().DEFAULT_TIME_FORMAT
-    return Column.invoke_expression_over_column(col, expression.UnixToStr, format=lit(format))
+    format = lit(format or spark_default_time_format())
+    return Column.invoke_expression_over_column(
+        col,
+        expression.UnixToStr,
+        format=format_time_from_spark(format),  # type: ignore
+    )
 @meta()
 def unix_timestamp(
     timestamp: t.Optional[ColumnOrName] = None, format: t.Optional[str] = None
 ) -> Column:
-    from sqlframe.base.session import _BaseSession
-    if format is None:
-        format = _BaseSession().DEFAULT_TIME_FORMAT
+    format = lit(format or spark_default_time_format())
     return Column.invoke_expression_over_column(
-        timestamp, expression.StrToUnix, format=lit(format)
+        timestamp,
+        expression.StrToUnix,
+        format=format_time_from_spark(format),  # type: ignore
     ).cast("bigint")
@@ -1289,7 +1300,7 @@ def array_agg(col: ColumnOrName) -> Column:
     return Column.invoke_expression_over_column(col, expression.ArrayAgg)
-@meta(unsupported_engines="*")
+@meta()
 def array_append(col: ColumnOrName, value: ColumnOrLiteral) -> Column:
     value = value if isinstance(value, Column) else lit(value)
     return Column.invoke_anonymous_function(col, "ARRAY_APPEND", value)
@@ -1737,7 +1748,7 @@ def map_zip_with(
     return Column.invoke_anonymous_function(col1, "MAP_ZIP_WITH", col2, Column(f_expression))
-@meta(unsupported_engines=["postgres", "snowflake"])
+@meta()
 def typeof(col: ColumnOrName) -> Column:
     return Column.invoke_anonymous_function(col, "TYPEOF")
@@ -2156,7 +2167,7 @@ def datepart(field: ColumnOrName, source: ColumnOrName) -> Column:
     return Column.invoke_anonymous_function(field, "datepart", source)
-@meta(unsupported_engines="*")
+@meta(unsupported_engines=["bigquery", "postgres", "snowflake"])
 def day(col: ColumnOrName) -> Column:
     return Column.invoke_expression_over_column(col, expression.Day)
@@ -5106,8 +5117,11 @@ def to_unix_timestamp(
     [Row(r=None)]
     >>> spark.conf.unset("spark.sql.session.timeZone")
     """
+    format = lit(spark_default_time_format()) if format is None else format
     if format is not None:
-        return Column.invoke_expression_over_column(timestamp, expression.StrToUnix, format=format)
+        return Column.invoke_expression_over_column(
+            timestamp, expression.StrToUnix, format=format_time_from_spark(format)
+        )
     else:
         return Column.invoke_expression_over_column(timestamp, expression.StrToUnix)
@@ -5268,7 +5282,7 @@ def try_element_at(col: ColumnOrName, extraction: ColumnOrName) -> Column:
     )
-@meta(unsupported_engines="*")
+@meta()
 def try_to_timestamp(col: ColumnOrName, format: t.Optional[ColumnOrName] = None) -> Column:
     """
     Parses the `col` with the `format` to a timestamp. The function always
@@ -5293,10 +5307,8 @@ def try_to_timestamp(col: ColumnOrName, format: t.Optional[ColumnOrName] = None)
     >>> df.select(try_to_timestamp(df.t, lit('yyyy-MM-dd HH:mm:ss')).alias('dt')).collect()
     [Row(dt=datetime.datetime(1997, 2, 28, 10, 30))]
     """
-    if format is not None:
-        return Column.invoke_anonymous_function(col, "try_to_timestamp", format)
-    else:
-        return Column.invoke_anonymous_function(col, "try_to_timestamp")
+    format = lit(format or spark_default_time_format())
+    return Column.invoke_anonymous_function(col, "try_to_timestamp", format_time_from_spark(format))  # type: ignore
 @meta()
@@ -5324,7 +5336,7 @@ def ucase(str: ColumnOrName) -> Column:
     return Column.invoke_expression_over_column(str, expression.Upper)
-@meta()
+@meta(unsupported_engines=["bigquery", "snowflake"])
 def unix_date(col: ColumnOrName) -> Column:
     """Returns the number of days since 1970-01-01.
@@ -5788,6 +5800,20 @@ def years(col: ColumnOrName) -> Column:
     return Column.invoke_anonymous_function(col, "years")
+# SQLFrame specific
+@meta()
+def _is_string(col: ColumnOrName) -> Column:
+    col = Column.invoke_anonymous_function(col, "TO_VARIANT")
+    return Column.invoke_anonymous_function(col, "IS_VARCHAR")
+@meta()
+def _is_date(col: ColumnOrName) -> Column:
+    typeof = get_func_from_session("typeof")
+    upper = get_func_from_session("upper")
+    return lit(upper(typeof(col)) == lit("DATE"))
 @meta()
 def _lambda_quoted(value: str) -> t.Optional[bool]:
     return False if value == "_" else None

sqlframe/base/session.py CHANGED Viewed

@@ -72,7 +72,6 @@ class _BaseSession(t.Generic[CATALOG, READER, WRITER, DF, CONN]):
     _df: t.Type[DF]
     SANITIZE_COLUMN_NAMES = False
-    DEFAULT_TIME_FORMAT = "yyyy-MM-dd HH:mm:ss"
     def __init__(
         self,
@@ -114,6 +113,10 @@ class _BaseSession(t.Generic[CATALOG, READER, WRITER, DF, CONN]):
     def _cur(self) -> DBAPICursorWithPandas:
         return self._conn.cursor()
+    @property
+    def default_time_format(self) -> str:
+        return self.output_dialect.TIME_FORMAT.strip("'")
     def _sanitize_column_name(self, name: str) -> str:
         if self.SANITIZE_COLUMN_NAMES:
             return name.replace("(", "_").replace(")", "_")

sqlframe/base/util.py CHANGED Viewed

@@ -13,7 +13,12 @@ if t.TYPE_CHECKING:
     from pyspark.sql.dataframe import SparkSession as PySparkSession
     from sqlframe.base import types
-    from sqlframe.base._typing import OptionalPrimitiveType, SchemaInput
+    from sqlframe.base._typing import (
+        ColumnOrLiteral,
+        OptionalPrimitiveType,
+        SchemaInput,
+    )
+    from sqlframe.base.column import Column
     from sqlframe.base.session import _BaseSession
     from sqlframe.base.types import StructType
@@ -342,3 +347,25 @@ def sqlglot_to_spark(sqlglot_dtype: exp.DataType) -> types.DataType:
             ]
         )
     raise NotImplementedError(f"Unsupported data type: {sqlglot_dtype}")
+def format_time_from_spark(value: ColumnOrLiteral) -> Column:
+    from sqlframe.base.column import Column
+    from sqlframe.base.session import _BaseSession
+    lit = get_func_from_session("lit")
+    value = lit(value) if not isinstance(value, Column) else value
+    formatted_time = Dialect["spark"].format_time(value.expression)
+    return Column(
+        _BaseSession()
+        .output_dialect.generator()
+        .format_time(exp.StrToTime(this=exp.Null(), format=formatted_time))
+    )
+def spark_default_time_format() -> str:
+    return Dialect["spark"].TIME_FORMAT.strip("'")
+def spark_default_date_format() -> str:
+    return Dialect["spark"].DATE_FORMAT.strip("'")

sqlframe/bigquery/functions.py CHANGED Viewed

@@ -7,7 +7,11 @@ import typing as t
 from sqlglot import exp as sqlglot_expression
 import sqlframe.base.functions
-from sqlframe.base.util import get_func_from_session
+from sqlframe.base.util import (
+    format_time_from_spark,
+    get_func_from_session,
+    spark_default_time_format,
+)
 from sqlframe.bigquery.column import Column
 if t.TYPE_CHECKING:
@@ -68,6 +72,9 @@ from sqlframe.base.function_alternatives import (  # noqa
     array_union_using_array_concat as array_union,
     sequence_from_generate_array as sequence,
     position_as_strpos as position,
+    try_to_timestamp_safe as try_to_timestamp,
+    _is_string_using_typeof_string as _is_string,
+    array_append_using_array_cat as array_append,
 )
@@ -148,23 +155,15 @@ def from_unixtime(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
     session: _BaseSession = _BaseSession()
     lit = get_func_from_session("lit")
-    to_timestamp = get_func_from_session("to_timestamp")
     expressions = [Column.ensure_col(col).expression]
-    if format is not None:
-        expressions.append(lit(format).expression)
     return Column(
         sqlglot_expression.Anonymous(
             this="FORMAT_TIMESTAMP",
             expressions=[
-                lit(session.DEFAULT_TIME_FORMAT).expression,
-                to_timestamp(
-                    Column(
-                        sqlglot_expression.Anonymous(
-                            this="TIMESTAMP_SECONDS", expressions=expressions
-                        )
-                    ),
-                    format,
+                lit(session.default_time_format).expression,
+                Column(
+                    sqlglot_expression.Anonymous(this="TIMESTAMP_SECONDS", expressions=expressions)
                 ).expression,
             ],
         )
@@ -174,12 +173,9 @@ def from_unixtime(col: ColumnOrName, format: t.Optional[str] = None) -> Column:
 def unix_timestamp(
     timestamp: t.Optional[ColumnOrName] = None, format: t.Optional[str] = None
 ) -> Column:
-    from sqlframe.base.session import _BaseSession
     lit = get_func_from_session("lit")
-    if format is None:
-        format = _BaseSession().DEFAULT_TIME_FORMAT
+    format = lit(format or spark_default_time_format())
     return Column(
         sqlglot_expression.Anonymous(
             this="UNIX_SECONDS",
@@ -187,7 +183,7 @@ def unix_timestamp(
                 sqlglot_expression.Anonymous(
                     this="PARSE_TIMESTAMP",
                     expressions=[
-                        lit(format).expression,
+                        format_time_from_spark(format).expression,
                         Column.ensure_col(timestamp).expression,
                         lit("UTC").expression,
                     ],

sqlframe/bigquery/functions.pyi CHANGED Viewed

@@ -267,7 +267,6 @@ from sqlframe.base.functions import trunc as trunc
 from sqlframe.base.functions import ucase as ucase
 from sqlframe.base.functions import unbase64 as unbase64
 from sqlframe.base.functions import unhex as unhex
-from sqlframe.base.functions import unix_date as unix_date
 from sqlframe.base.functions import upper as upper
 from sqlframe.base.functions import user as user
 from sqlframe.base.functions import var_pop as var_pop

sqlframe/bigquery/session.py CHANGED Viewed

@@ -32,7 +32,6 @@ class BigQuerySession(
     _writer = BigQueryDataFrameWriter
     _df = BigQueryDataFrame
-    DEFAULT_TIME_FORMAT = "%Y-%m-%d %H:%M:%S"
     QUALIFY_INFO_SCHEMA_WITH_DATABASE = True
     SANITIZE_COLUMN_NAMES = True

sqlframe/duckdb/functions.py CHANGED Viewed

@@ -46,5 +46,8 @@ from sqlframe.base.function_alternatives import (  # noqa
     array_max_from_sort as array_max,
     sequence_from_generate_series as sequence,
     try_element_at_zero_based as try_element_at,
-    to_unix_timestamp_include_default_format as to_unix_timestamp,
+    day_with_try_to_timestamp as day,
+    try_to_timestamp_strptime as try_to_timestamp,
+    _is_string_using_typeof_varchar as _is_string,
+    array_append_list_append as array_append,
 )

sqlframe/duckdb/session.py CHANGED Viewed

@@ -33,8 +33,6 @@ class DuckDBSession(
     _writer = DuckDBDataFrameWriter
     _df = DuckDBDataFrame
-    DEFAULT_TIME_FORMAT = "%Y-%m-%d %H:%M:%S"
     def __init__(self, conn: t.Optional[DuckDBPyConnection] = None, *args, **kwargs):
         import duckdb
         from duckdb.typing import VARCHAR

sqlframe/postgres/functions.py CHANGED Viewed

@@ -64,4 +64,7 @@ from sqlframe.base.function_alternatives import (  # noqa
     right_cast_len as right,
     position_cast_start as position,
     try_element_at_zero_based as try_element_at,
+    try_to_timestamp_pgtemp as try_to_timestamp,
+    typeof_pg_typeof as typeof,
+    _is_string_using_typeof_char_varying as _is_string,
 )

sqlframe/postgres/session.py CHANGED Viewed

@@ -34,12 +34,18 @@ class PostgresSession(
     _writer = PostgresDataFrameWriter
     _df = PostgresDataFrame
-    DEFAULT_TIME_FORMAT = "yyyy-MM-dd HH:MI:SS"
     def __init__(self, conn: t.Optional[psycopg2_connection] = None):
         if not hasattr(self, "_conn"):
             super().__init__(conn)
             self._execute("CREATE EXTENSION IF NOT EXISTS fuzzystrmatch")
+            self._execute("""CREATE OR REPLACE FUNCTION pg_temp.try_to_timestamp(input_text TEXT, format TEXT)
+RETURNS TIMESTAMP AS $$
+BEGIN
+    RETURN TO_TIMESTAMP(input_text, format);
+EXCEPTION WHEN OTHERS THEN
+    RETURN NULL;
+END;
+$$ LANGUAGE plpgsql;""")
     def _fetch_rows(
         self, sql: t.Union[str, exp.Expression], *, quote_identifiers: bool = True

sqlframe/snowflake/functions.py CHANGED Viewed

@@ -63,4 +63,6 @@ from sqlframe.base.function_alternatives import (  # noqa
     map_concat_using_map_cat as map_concat,
     sequence_from_array_generate_range as sequence,
     to_number_using_to_double as to_number,
+    typeof_from_variant as typeof,
+    to_date_time_format as to_date,
 )

sqlframe/snowflake/functions.pyi CHANGED Viewed

@@ -207,7 +207,6 @@ from sqlframe.base.functions import (
     trim as trim,
     trunc as trunc,
     ucase as ucase,
-    unix_date as unix_date,
     upper as upper,
     user as user,
     var_pop as var_pop,

sqlframe/snowflake/session.py CHANGED Viewed

@@ -57,8 +57,6 @@ class SnowflakeSession(
     _writer = SnowflakeDataFrameWriter
     _df = SnowflakeDataFrame
-    DEFAULT_TIME_FORMAT = "YYYY-MM-DD HH:MI:SS"
     def __init__(self, conn: t.Optional[SnowflakeConnection] = None):
         import snowflake

sqlframe/spark/functions.py CHANGED Viewed

@@ -17,4 +17,5 @@ from sqlframe.base.function_alternatives import (  # noqa
     percentile_without_disc as percentile,
     add_months_by_multiplication as add_months,
     arrays_overlap_renamed as arrays_overlap,
+    _is_string_using_typeof_string_lcase as _is_string,
 )

{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: sqlframe
-Version: 1.12.0
+Version: 1.14.0
 Summary: Turning PySpark Into a Universal DataFrame API
 Home-page: https://github.com/eakmanrq/sqlframe
 Author: Ryan Eakman
@@ -18,7 +18,7 @@ Requires-Python: >=3.8
 Description-Content-Type: text/markdown
 License-File: LICENSE
 Requires-Dist: prettytable (<3.11.0)
-Requires-Dist: sqlglot (<25.4,>=24.0.0)
+Requires-Dist: sqlglot (<25.5,>=24.0.0)
 Requires-Dist: typing-extensions (<5,>=4.8)
 Provides-Extra: bigquery
 Requires-Dist: google-cloud-bigquery-storage (<3,>=2) ; extra == 'bigquery'
@@ -35,7 +35,7 @@ Requires-Dist: pyspark (<3.6,>=2) ; extra == 'dev'
 Requires-Dist: pytest-postgresql (<7,>=6) ; extra == 'dev'
 Requires-Dist: pytest-xdist (<3.7,>=3.6) ; extra == 'dev'
 Requires-Dist: pytest (<8.3,>=8.2.0) ; extra == 'dev'
-Requires-Dist: ruff (<0.5,>=0.4.4) ; extra == 'dev'
+Requires-Dist: ruff (<0.6,>=0.4.4) ; extra == 'dev'
 Requires-Dist: types-psycopg2 (<3,>=2.9) ; extra == 'dev'
 Requires-Dist: pre-commit (>=3.5) ; (python_version == "3.8") and extra == 'dev'
 Requires-Dist: pre-commit (<3.8,>=3.7) ; (python_version >= "3.9") and extra == 'dev'

{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/RECORD RENAMED Viewed

@@ -1,5 +1,5 @@
 sqlframe/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-sqlframe/_version.py,sha256=cgR9Mx-45EIoPNcTiuL_LLmCR2oVTYIPi5z0W11owvc,413
+sqlframe/_version.py,sha256=P7Qh1JtG4Is-HJ-aT0XbCm84DoRrTTlY2cMmIjRTLGQ,413
 sqlframe/base/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 sqlframe/base/_typing.py,sha256=DuTay8-o9W-pw3RPZCgLunKNJLS9PkaV11G_pxXp9NY,1256
 sqlframe/base/catalog.py,sha256=ATDGirouUjal05P4ymL-wIi8rgjg_8w4PoACamiO64A,37245
@@ -7,16 +7,16 @@ sqlframe/base/column.py,sha256=y41rFV7y_seTNkAK3SSqnggGi2otXt0ejKzsMyHCYT4,17515
 sqlframe/base/dataframe.py,sha256=75ZM9r52fufFmVShtntcDUr6dZ1stX9HDmXLuDrYTAU,71004
 sqlframe/base/decorators.py,sha256=I5osMgx9BuCgbtp4jVM2DNwYJVLzCv-OtTedhQEik0g,1882
 sqlframe/base/exceptions.py,sha256=9Uwvqn2eAkDpqm4BrRgbL61qM-GMCbJEMAW8otxO46s,370
-sqlframe/base/function_alternatives.py,sha256=l6Fu0mZ-eleObpYcCAnOXV1HvuHugeoCFUcSV7NmFis,45916
-sqlframe/base/functions.py,sha256=hSLuyO03m2dXPJdmVKp9of-_xj4V2sUhSzJ65Ti240Q,187616
+sqlframe/base/function_alternatives.py,sha256=B4UkHuUD1COc4xRm20pNtDloyMU6mhhesEZ3yWwaBJE,49702
+sqlframe/base/functions.py,sha256=L_I028dDt2th9DeKIheidMLY8jjFICvze4Gw7F62NUk,188446
 sqlframe/base/group.py,sha256=TES9CleVmH3x-0X-tqmuUKfCKSWjH5vg1aU3R6dDmFc,4059
 sqlframe/base/normalize.py,sha256=nXAJ5CwxVf4DV0GsH-q1w0p8gmjSMlv96k_ez1eVul8,3880
 sqlframe/base/operations.py,sha256=-AhNuEzcV7ZExoP1oY3blaKip-joQyJeQVvfBTs_2g4,3456
 sqlframe/base/readerwriter.py,sha256=5NPQMiOrw6I54U243R_6-ynnWYsNksgqwRpPp4IFjIw,25288
-sqlframe/base/session.py,sha256=2C0OsPoP49AuqVNtPiazTdVpwQA1668g5WOydrYP6SA,22001
+sqlframe/base/session.py,sha256=gg0OX6MK6sV4t91aS7GtyYGXhefXnm33433XDw5GpLY,22068
 sqlframe/base/transforms.py,sha256=y0j3SGDz3XCmNGrvassk1S-owllUWfkHyMgZlY6SFO4,467
 sqlframe/base/types.py,sha256=iBNk9bpFtb2NBIogYS8i7OlQZMRvpR6XxqzBebsjQDU,12280
-sqlframe/base/util.py,sha256=tWccrZne-Acn4N2RxYr87mfI_GDMf_K9hRD7BnhGBq0,11756
+sqlframe/base/util.py,sha256=l6zu-3SzE2e0-iDMH0GD55gsxYx362tVc0QA6eLPvYk,12530
 sqlframe/base/window.py,sha256=8hOv-ignPPIsZA9FzvYzcLE9J_glalVaYjIAUdRUX3o,4943
 sqlframe/base/mixins/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 sqlframe/base/mixins/catalog_mixins.py,sha256=NhuPGxIqPjyuC_V_NALN1sn9v9h0-xwFOlJyJgsvyek,14212
@@ -26,33 +26,33 @@ sqlframe/bigquery/__init__.py,sha256=i2NsMbiXOj2xphCtPuNk6cVw4iYeq5_B1I9dVI9aGAk
 sqlframe/bigquery/catalog.py,sha256=h3aQAQAJg6MMvFpP8Ku0S4pcx30n5qYrqHhWSomxb6A,9319
 sqlframe/bigquery/column.py,sha256=E1tUa62Y5HajkhgFuebU9zohrGyieudcHzTT8gfalio,40
 sqlframe/bigquery/dataframe.py,sha256=Y2uy4FEYw0KxIHgnaA9uMwdIzxJzTlD_NSzIe7P7kxA,2405
-sqlframe/bigquery/functions.py,sha256=ifJxEyHDwSp2iA-yBt7XHLh9GhVPpgzs5YckMFvag8w,11370
-sqlframe/bigquery/functions.pyi,sha256=JiyLFLiO0jyJec6j1o4ujPVQ7Tma-c9YHlm-3UQYD9M,13642
+sqlframe/bigquery/functions.py,sha256=Suy4KX75pYIpYrXgN1Af0NLf73ahuS7PmhNY2FkQhnk,11255
+sqlframe/bigquery/functions.pyi,sha256=BCYqHpZzv4KWVtTuiC9wCSzXdxeHsz9gwkEvKzwHnoY,13583
 sqlframe/bigquery/group.py,sha256=UVBNBRTo8OqS-_cS5YwvTeJYgYxeG-d6R3kfyHmlFqw,391
 sqlframe/bigquery/readwriter.py,sha256=WAD3ZMwkkjOpvPPoZXfaLLNM6tRTeUvdEj-hQZAzXeo,870
-sqlframe/bigquery/session.py,sha256=1-hE1Wr2b6SqfD4M_-OGMqjaSbhD6wSQd74v71xHZv8,2709
+sqlframe/bigquery/session.py,sha256=rOFAtCGWXjtM5Vc5_XiDlJv7H8K_Ga9h2M97if3F0mM,2663
 sqlframe/bigquery/types.py,sha256=KwNyuXIo-2xVVd4bZED3YrQOobKCtemlxGrJL7DrTC8,34
 sqlframe/bigquery/window.py,sha256=6GKPzuxeSapJakBaKBeT9VpED1ACdjggDv9JRILDyV0,35
 sqlframe/duckdb/__init__.py,sha256=t85TA3ufZtL1weQNFmEs8itCSwbJFtw03-p0GT4XGf8,669
 sqlframe/duckdb/catalog.py,sha256=rt3XuP3m4DbhuibOFyvx_95F2zZa6uDwCI_TmcvKy1A,3895
 sqlframe/duckdb/column.py,sha256=wkEPcp3xVsH5nC3kpacXqNkRv9htPtBgt-0uFRxIRNs,56
 sqlframe/duckdb/dataframe.py,sha256=WmBrrmrfxDpYuikSMFqacgV2Jawkx4sSYE-_mwnL4Jw,1225
-sqlframe/duckdb/functions.py,sha256=pz40eqR4U_s42p7UeaefJD5yU1vo6mqNoVz0iKN5eRk,1671
+sqlframe/duckdb/functions.py,sha256=RXwfP3Ls9OYpNNHT5f0yjKxxaDqrqSAj2qCD1esMW-U,1790
 sqlframe/duckdb/functions.pyi,sha256=nU-6a2cfLDkuMCdYrNRLfa6-i8Aa0CxQQ1nLT6roIdI,5813
 sqlframe/duckdb/group.py,sha256=IkhbW42Ng1U5YT3FkIdiB4zBqRkW4QyTb-1detY1e_4,383
 sqlframe/duckdb/readwriter.py,sha256=6xiyE3JKzY9ieKqvbAOBlifiHE6NpYISHul3Idlmoa0,4542
-sqlframe/duckdb/session.py,sha256=j75iIsmaxl5x7oqyhN_VolvEclKj7QmaFfIis-SmoKM,2147
+sqlframe/duckdb/session.py,sha256=pk1b-eR2RPr7SJYftnHKfZj5EXuN-D5xanUHLoWNMYU,2100
 sqlframe/duckdb/types.py,sha256=KwNyuXIo-2xVVd4bZED3YrQOobKCtemlxGrJL7DrTC8,34
 sqlframe/duckdb/window.py,sha256=6GKPzuxeSapJakBaKBeT9VpED1ACdjggDv9JRILDyV0,35
 sqlframe/postgres/__init__.py,sha256=Sz_MtgV_oh_QhfZTC7iKM07ICUmNcJEDV0kEkSW9ZKU,712
 sqlframe/postgres/catalog.py,sha256=uGMKo4RXOU6fA4IjcfebukEI18QswVk3cnB_G7S6_Fw,8130
 sqlframe/postgres/column.py,sha256=E1tUa62Y5HajkhgFuebU9zohrGyieudcHzTT8gfalio,40
 sqlframe/postgres/dataframe.py,sha256=f-w6UHxZtmeZ5oMbaqJaZ8FrYeOhzyveNlZOK57ke0k,1289
-sqlframe/postgres/functions.py,sha256=b9ccP5vY8EDZXkJbhE_LjAlH50_6wcUF9VbzPrariec,2374
+sqlframe/postgres/functions.py,sha256=HV9wLwrFtlwRJlTW4ipEx4XerFLREeGdKnBbqYe70WE,2511
 sqlframe/postgres/functions.pyi,sha256=um-qE2g9iPs0-53vJ46lArbfvDqAbFIwrxLJgcrPM_8,5536
 sqlframe/postgres/group.py,sha256=KUXeSFKWTSH9yCRJAhW85OvjZaG6Zr4In9LR_ie3yGU,391
 sqlframe/postgres/readwriter.py,sha256=L1e3yKXzFVNR_W5s1DHaWol7G8x7l4jcZ5sLGualyMk,870
-sqlframe/postgres/session.py,sha256=oKh8-j9MN6msVheQNCYoGmej9ktFLTTHmlMP58uZ3nw,1936
+sqlframe/postgres/session.py,sha256=YuWvzuPhhCt9bSN_ZCUp9WYWx4XW7_PGbMdTGRuqGzE,2147
 sqlframe/postgres/types.py,sha256=KwNyuXIo-2xVVd4bZED3YrQOobKCtemlxGrJL7DrTC8,34
 sqlframe/postgres/window.py,sha256=6GKPzuxeSapJakBaKBeT9VpED1ACdjggDv9JRILDyV0,35
 sqlframe/redshift/__init__.py,sha256=jamKYQtQaKjjXnQ01QGPHvatbrZSw9sWno_VOUGSz6I,712
@@ -69,18 +69,18 @@ sqlframe/snowflake/__init__.py,sha256=nuQ3cuHjDpW4ELZfbd2qOYmtXmcYl7MtsrdOrRdozo
 sqlframe/snowflake/catalog.py,sha256=uDjBgDdCyxaDkGNX_8tb-lol7MwwazcClUBAZsOSj70,5014
 sqlframe/snowflake/column.py,sha256=E1tUa62Y5HajkhgFuebU9zohrGyieudcHzTT8gfalio,40
 sqlframe/snowflake/dataframe.py,sha256=jUyQNCe3K6SH4PtmrR67YN0SLqkHakMxLiB261fDgkc,1862
-sqlframe/snowflake/functions.py,sha256=cIO56ZsOpjg6ICLjTh-osG1h1UjjEtM39_ieMiWkmyI,2466
-sqlframe/snowflake/functions.pyi,sha256=MkNif_sIceHMNhl-qvLir2DJ1jPqwyaahltdpgY4Jq0,6213
+sqlframe/snowflake/functions.py,sha256=lyKIiChgfr97EaxI4tAapaFSToUgT2RqyqfiHl91ZNo,2537
+sqlframe/snowflake/functions.pyi,sha256=wqUPXuZxjRY0rPY2BRAb7XXkWYP1DyuDzvlriRySdSw,6185
 sqlframe/snowflake/group.py,sha256=pPP1l2RRo_LgkXrji8a87n2PKo-63ZRPT-WUtvVcBME,395
 sqlframe/snowflake/readwriter.py,sha256=yhRc2HcMq6PwV3ghZWC-q-qaE7LE4aEjZEXCip4OOlQ,884
-sqlframe/snowflake/session.py,sha256=bDOlnuIiQ9j_zfF7F5H1gTLmpHUjruIxr2CfXcS_7YU,3284
+sqlframe/snowflake/session.py,sha256=_EBXr6-GQAksAYqAE-Dv3HJMnrAEGINH0IzCDoIswJE,3235
 sqlframe/snowflake/types.py,sha256=KwNyuXIo-2xVVd4bZED3YrQOobKCtemlxGrJL7DrTC8,34
 sqlframe/snowflake/window.py,sha256=6GKPzuxeSapJakBaKBeT9VpED1ACdjggDv9JRILDyV0,35
 sqlframe/spark/__init__.py,sha256=WhYQAZMJN1EMNAVGUH7BEinxNdYtXOrrr-6HUniJOyI,649
 sqlframe/spark/catalog.py,sha256=rIX5DtPnINbcPZRUe4Z1bOpkJoNRlrO9qWkUeTQClNc,32612
 sqlframe/spark/column.py,sha256=E1tUa62Y5HajkhgFuebU9zohrGyieudcHzTT8gfalio,40
 sqlframe/spark/dataframe.py,sha256=_TD-h7oz0-i80r90v17UoLDoIzcGNchU2SL13ujOOic,1779
-sqlframe/spark/functions.py,sha256=PkK4MBpVADhnDbrgFDii5zFaNrhi4y-OYX3Lcu-SW0k,530
+sqlframe/spark/functions.py,sha256=AQfqfvaojJzCuo9DyDklz0JYZPhn_3dzWvztsklBO0o,586
 sqlframe/spark/functions.pyi,sha256=bjz6s8E6OB0c4KfTTsls7rhb_R9mIYvkaeaXefMziqM,11617
 sqlframe/spark/group.py,sha256=MrvV_v-YkBc6T1zz882WrEqtWjlooWIyHBCmTQg3fCA,379
 sqlframe/spark/readwriter.py,sha256=w68EImTcGJv64X7pc1tk5tDjDxb1nAnn-MiIaaN9Dc8,812
@@ -99,8 +99,8 @@ sqlframe/standalone/types.py,sha256=KwNyuXIo-2xVVd4bZED3YrQOobKCtemlxGrJL7DrTC8,
 sqlframe/standalone/window.py,sha256=6GKPzuxeSapJakBaKBeT9VpED1ACdjggDv9JRILDyV0,35
 sqlframe/testing/__init__.py,sha256=VVCosQhitU74A3NnE52O4mNtGZONapuEXcc20QmSlnQ,132
 sqlframe/testing/utils.py,sha256=9DDYVuocO7tygee3RaajuJNZ24sJwf_LY556kKg7kTw,13011
-sqlframe-1.12.0.dist-info/LICENSE,sha256=VZu79YgW780qxaFJMr0t5ZgbOYEh04xWoxaWOaqIGWk,1068
-sqlframe-1.12.0.dist-info/METADATA,sha256=pSBFDDNjWo6RscllTU6EquCE1DG0C8FXmuad1RINxgk,7497
-sqlframe-1.12.0.dist-info/WHEEL,sha256=G16H4A3IeoQmnOrYV4ueZGKSjhipXx8zc8nu9FGlvMA,92
-sqlframe-1.12.0.dist-info/top_level.txt,sha256=T0_RpoygaZSF6heeWwIDQgaP0varUdSK1pzjeJZRjM8,9
-sqlframe-1.12.0.dist-info/RECORD,,
+sqlframe-1.14.0.dist-info/LICENSE,sha256=VZu79YgW780qxaFJMr0t5ZgbOYEh04xWoxaWOaqIGWk,1068
+sqlframe-1.14.0.dist-info/METADATA,sha256=Bm9d-eqk6pN20TX6hzR2xeppjjWuelyqOf87i8e4eRQ,7497
+sqlframe-1.14.0.dist-info/WHEEL,sha256=G16H4A3IeoQmnOrYV4ueZGKSjhipXx8zc8nu9FGlvMA,92
+sqlframe-1.14.0.dist-info/top_level.txt,sha256=T0_RpoygaZSF6heeWwIDQgaP0varUdSK1pzjeJZRjM8,9
+sqlframe-1.14.0.dist-info/RECORD,,

{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/LICENSE RENAMED Viewed

File without changes

{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/WHEEL RENAMED Viewed

File without changes

{sqlframe-1.12.0.dist-info → sqlframe-1.14.0.dist-info}/top_level.txt RENAMED Viewed

File without changes

sqlframe 1.12.0__py3-none-any.whl → 1.14.0__py3-none-any.whl

sqlframe 1.12.0py3-none-any.whl → 1.14.0py3-none-any.whl