mlflow · harupy · Dec 7, 2021 · Dec 17, 2020 · Dec 7, 2021 · Dec 7, 2021
diff --git a/tests/pyfunc/test_spark.py b/tests/pyfunc/test_spark.py
@@ -263,10 +263,8 @@ def get_model(_):
     # Note that we can't necessarily expect an even split, or even that there were only
     # exactly 2 python processes launched, due to Spark and its mysterious ways, but we do
     # expect significant reuse.
-    results = spark.sparkContext.parallelize(range(0, 100), 30).map(get_model).collect()
-
-    # TODO(tomas): Looks like spark does not reuse python workers with python==3.x
-    assert sys.version[0] == "3" or max(results) > 10
+    results = spark.sparkContext.parallelize(range(100), 30).map(get_model).collect()
+    assert max(results) > 10
     # Running again should see no newly-loaded models.
-    results2 = spark.sparkContext.parallelize(range(0, 100), 30).map(get_model).collect()
-    assert sys.version[0] == "3" or min(results2) > 0
+    results2 = spark.sparkContext.parallelize(range(100), 30).map(get_model).collect()
+    assert min(results2) > 0