java lire es cedd 图片相似搜索

我最喜欢直接贴代码

es 8.2.2

<dependency>
            <groupId>co.elastic.clients</groupId>
            <artifactId>elasticsearch-java</artifactId>
            <version>8.2.2</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-client</artifactId>
            <version>8.2.2</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch-x-content</artifactId>
            <version>8.2.2</version>
        </dependency>
        <dependency>
            <groupId>com.github.zengde</groupId>
            <artifactId>lire</artifactId>
            <version>1.0b2</version>
        </dependency>

    // 获取csclient
    private static ElasticsearchClient createElasticsearchClient() {
        String host = "10.6.30.139";
        Integer port = 9200;
        RestClient restClient = RestClient.builder(new HttpHost(host, port, "http")).build();
        ElasticsearchTransport transport = new RestClientTransport(restClient, new JacksonJsonpMapper());
        ElasticsearchClient client = new ElasticsearchClient(transport);
        System.out.println(client);
        return client;
    }


// 新建索引 dims指定144维度
private static void createIndex() throws IOException {
        String mapping = "{" +
                "  \"mappings\": {" +
                /*                "    \"product\":{" +*/
                "      \"properties\": {" +
                "        \"imageVector\": {" +
                "          \"type\": \"dense_vector\"," +
                "          \"dims\": 144," +
                "          \"index\": true,\n" +
                "          \"similarity\": \"dot_product\"" +
                "        }," +
                "        \"imageUrl\": {" +
                "          \"type\": \"text\"" +
                "        }" +
                "      }" +
                /*"    }" +*/
                "  }" +
                "}";
        // 额外指定 index 为 true 是因为,为了实现 _knn_search,ES 必须在底层构建一个新的数据结构(目前使用的是 HNSW graph )。
        // similarity 指定向量相似度算法,可以是 l2_norm 、dot_product、cosine
        CreateIndexRequest request = new CreateIndexRequest.Builder().index(INDEX_NAME).withJson(IOUtils.toInputStream(mapping, StandardCharsets.UTF_8)).build();
        CreateIndexResponse response = client.indices().create(request);
        System.out.println(response);
    }

//根据图片地址返回144维度cedd向量
private static double[] imageVector(String url) throws Exception {
        url = OssUtils.processPic(url, "?x-oss-process=image/resize,m_lfit,h_250,w_250");
        System.out.println(url);
        BufferedImage img = ImageIO.read(new URL(url));
        CEDD lireFeature = new CEDD();
        lireFeature.extract(img);
        byte[] byteHistogram = lireFeature.getByteHistogram();
        printArray(byteHistogram);
        double[] ds = SerializationUtils.castToDoubleArray(byteHistogram);
        printArray(ds);
        return ds;
    }

//根据图片地址返回144维度cedd向量
    private static List<Double> imageVectorList(String url) throws Exception {
        double[] searchVector = imageVector(url);
        List<Double> vectors = new ArrayList<>();
        for (double d : searchVector) {
            vectors.add(d);
        }
        return vectors;
    }

// 增加索引
    public static void index(String url, Long productId) throws Exception {
        Map<String, Object> doc = new HashMap();
        doc.put("imageVector", imageVector(url));
        doc.put("imageUrl", OssUtils.processPic(url, ""));
        IndexRequest<Object> request = new IndexRequest.Builder<>().index(INDEX_NAME).id(productId + "").document(doc).build();
        IndexResponse response = client.index(request);
    }


//搜索
public static Pager<HashMap> search(String url, Integer pageNum, Integer pageSize) throws Exception {
        Pager<HashMap> pager = new Pager(pageNum, pageSize);
        List<Double> vectors = imageVectorList(url);
        InlineScript inlineScript = new InlineScript.Builder()
                .source("cosineSimilarity(params.query_vector, 'imageVector') + 1.0")
                .params("query_vector", JsonData.of(vectors)).build();
        Script script = new Script.Builder().inline(inlineScript).build();
        ScriptScoreQuery scriptScoreQuery = new ScriptScoreQuery.Builder().script(script).query(new MatchAllQuery.Builder().build()._toQuery()).build();
        SearchRequest request = new SearchRequest.Builder().index(INDEX_NAME).from(pager.getFirstResult()).size(pager.getPageSize())
                .query(scriptScoreQuery._toQuery()).build();
        SearchResponse<HashMap> response = client.search(request, HashMap.class);
        List<HashMap> datas = new ArrayList<>();
        for (Hit<HashMap> hit : response.hits().hits()) {
//            System.out.println(hit.id() + " -- " + hit.score() + " -- " + hit.source());
            HashMap data = hit.source();
            data.put("id", hit.id());
            data.put("score", hit.score());
            datas.add(data);
        }
        pager.setDatas(datas);
        return pager;
    }

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容