Read data saved by spark redis using Java

Question

I using spark-redis to save Dataset to Redis. Then I read this data by using Spring data redis: This object I save to redis: Save object by using spark-redis: Repository: I can&#8217;t read this data have been saved in Redis by using Spring data redis because structure data saved by spark-redis and spring dat…

Accepted Answer

The following works for me.Writing data from spark-redis.I use Scala here, but it&#8217;s essentially the same as you do in Java. The only thing I changed is I added a .option("key.column", "id") to specify the hash id.    val ratingResult = new RatingResult("1", 1, "product1", 2.0, 3.0, 4)    val result: JavaRDD[RatingResult] = spark.sparkContext.parallelize(Seq(ratingResult)).toJavaRDD()    spark      .createDataFrame(result, classOf[RatingResult])      .write      .format("org.apache.spark.sql.redis")      .option("key.column", "id")      .option("table", "collaborative_filtering")      .mode(SaveMode.Overwrite)      .save()In spring-data-redis I have the following:@Getter@Setter@AllArgsConstructor@NoArgsConstructor@Builder@RedisHash("collaborative_filtering")public class RatingResult implements Serializable {    private static final long serialVersionUID = 8755574422193819444L;    @Id    private String id;    @Indexed    private int user;    @Indexed    private String product;    private double productN;    private double rating;    private float prediction;    @Override    public String toString() {        return "RatingResult{" +                "id='" + id + ''' +                ", user=" + user +                ", product='" + product + ''' +                ", productN=" + productN +                ", rating=" + rating +                ", prediction=" + prediction +                '}';    }}I use CrudRepository instead of JPA:@Repositorypublic interface RatingResultRepository extends CrudRepository<RatingResult, String> {}Querying:     RatingResult found = ratingResultRepository.findById("1").get();     System.out.println("found = " + found);The output:found = RatingResult{id='null', user=1, product='product1', productN=2.0, rating=3.0, prediction=4.0}You may notice that the id field was not populated because the spark-redis stored has a hash id and not as a hash attribute.

Advertisement

Answer