-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
serving镜像打包、注册到kuscia容器及使用问题 #128
Comments
查询serving的任务如下: 看起来是正常的 |
但是在调用推理预测的时候报错: |
使用命令kubectl get appimage [name] -oyaml 看一下配置 |
不清楚名称可以先执行kubectl get appimage 看一下serving的name |
我注册的时候用的是 -n后面的是sf-serving-image |
[root@idata-kuscia-autonomy-com2023011620063473637 kuscia]# kubectl get appimage sf-serving-image -oyaml
|
执行一下kubectl get pod -A 看一下 |
我的新推理的是"serving_id":"serving-2024120611252796246" |
[root@idata-kuscia-autonomy-com2023011620063473637 kuscia]# kubectl get pod -A |grep serving-2024120611252796246 |
ErrImagePull这个状态 |
[root@idata-kuscia-autonomy-com2023011620063473637 kuscia]# kubectl describe pod serving-2024120611252796246-f4464687d-84w4q -n com2023011620063473637 |
我这边网络有点问题,暂时看不到图片信息你这样操作一下试试。
|
在kuscia容器里查看的镜像名称好像是这个docker.io/library/serving-anolis8 [root@idata-kuscia-autonomy-com2023011620072311739 kuscia]# crictl images|grep serving |
对appinage 中的name 替换为docker.io/library/serving-anolis8 |
通过kubectl edit appimage sf-serving-image -oyaml命令改完 怎么让其生效呢 |
执行:wq保存后就会生效,你可以查询命令kubectl get xxx 验证一下是否成功 |
[root@idata-kuscia-autonomy-com2023011620063473637 kuscia]# kubectl get pod -A |grep serving-2024120614172177844 改完新发去serving推理任务状态是CrashLoopBackOff |
[root@idata-kuscia-autonomy-com2023011620063473637 kuscia]# kubectl describe pod serving-2024120614172177844-76cdf7dbc8-94xq2 -n com2023011620063473637 2024-12-06 14:17:26.677 [info] [retry_policy.cc:RetryPolicy:48] Create RetryPolicy:backoff_time:10ms
Conditions: Normal Scheduled 2m11s kuscia-scheduler Successfully assigned com2023011620063473637/serving-2024120614172177844-76cdf7dbc8-94xq2 to idata-kuscia-autonomy-com2023011620063473637 |
在这个路径上获取一下全量日志 /home/kuscia/var/stdout/pods/podName_xxxx/xxxx/x.log 辛苦通过上传文件的方式提供一下。 |
就这两个日志 |
我在feature_config.proto里 然后我在serving报文里传递的是 其中feature_source_config部分传递的是dbOpts可以吗,我自测是可以的呀 |
我建db_adapter_test.cc,在里面这样构造的 测试是可以的,但是没有测试这样的完整文档 |
看0.log日志里 为什么会报[main.cc:main:149] server startup failed, msg:[Enforce fail at ./secretflow_serving/feature_adapt |
kubectl get Deployment -A 看一下 |
[root@idata-kuscia-autonomy-com2023011620063473637 kuscia]# kubectl get Deployment -A |grep serving-2024120614172177844 |
|
有定义的。 以及 // Id column name, associated with FeatureParam::query_datas // Optional. |
我定义的是 DbOptions db_opts = 5; 是不是我在报文里传递的应该也是db_opts,而不应该缩写为dbOpts |
服务调用是通过kuscia API发起的还是allinone SecretPad 发起? |
是通过kuscia API发起的 |
你有注册自己db特征适配器吗?就像源码中的http_adapter、File_adapter 一样。 |
这边可以检查一下你的adapter实现中是否有进行了注册,参考:https://github.com/secretflow/serving/blob/main/secretflow_serving/feature_adapter/file_adapter.cc#L37 同时,请检查是否在模块的build中增加了你的adpater的构建,见:https://github.com/secretflow/serving/blob/main/secretflow_serving/feature_adapter/BUILD.bazel#L19 |
好的 非常感谢!!! |
问题解决了,感谢诸位 |
方便告知一下,你这个命令是从那个文档链接中获取的吗? |
我改了Dockerfile的基础镜像,使用FROM secretflow/ubuntu-base-ci:latest基础镜像,打包成镜像文件serving-anolis8_sv-12-05.tar,会导致镜像比原来的大很多。
然后注册到kuscia容器里,
显示注册进kuscia容器成功。
再进kuscia容器里查看
我是这么注册的:
1、将kuscia容器里的sf-serving-0.yaml拷贝出来,docker cp 851cfd0a2bbc:/home/kuscia/sf-serving-0.yaml ./
2、修改sf-serving-0.yaml里的最后部分的image配置
原:
image:
id: 91d26a38f00e
name: secretflow-registry.cn-hangzhou.cr.aliyuncs.com/secretflow/serving-anolis8
sign: abc13mnjh1olkkp1
tag: 0.3.1b0
修改为:
image:
name: serving-anolis8
tag: sv-12-05
3、执行
bash ./register_app_image/register_app_image.sh -u idata -d com2023011620063473637 -m p2p -n sf-serving-image -f ./register_app_image/sf-serving-0.yaml -i serving-anolis8:sv-12-05
注册完成后,我再发起在线推理请求报错,并且没有日志
The text was updated successfully, but these errors were encountered: