Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[BUG]在allinone部署后,修改host文件添加了业务网口,宿主机离线 #21769

Open
Misswjy opened this issue Dec 7, 2024 · 19 comments
Labels
bug Something isn't working state/awaiting processing

Comments

@Misswjy
Copy link

Misswjy commented Dec 7, 2024

在centos7.9环境下allinone安装3.11.8版本,在只有一个管理网口时正常,在添加业务网口重启host后,宿主机显示离线

@Misswjy Misswjy added the bug Something isn't working label Dec 7, 2024
@Misswjy
Copy link
Author

Misswjy commented Dec 7, 2024

在host文件中添加了下面 的字段
ovn_encap_ip: 192.168.100.2
networks:

  • eth0/br0/110.xx.xx.xx
  • bond0/br1/192.168.100.2

eth0是管理网口,bond0想做业务网口

@Misswjy
Copy link
Author

Misswjy commented Dec 7, 2024

下面是重启后default-host的pod的日志
[info 2024-12-07 16:42:39 informer.NewWatchManagerBySessionBg.func1(watcher.go:51)] callback with watchMan success.
[info 2024-12-07 16:42:41 hostinfo.(*SHostInfo).ensureMasterNetworks(hostinfo.go:1246)] Master ip 192.168.100.2 to fetch wire
[info 2024-12-07 16:42:41 hostinfo.(*SHostInfo).tryCreateNetworkOnWire(hostinfo.go:1217)] Get master ip 192.168.100.2 and mask 24
[error 2024-12-07 16:42:41 hostinfo.(*SHostInfo).onFail(hostinfo.go:1142)] register failed: initHostRecords: initHostRecord: try create network: find_matched == false: InvalidStatusError
[error 2024-12-07 16:42:41 hostinfo.(*SHostInfo).onFail(hostinfo.go:1148)] register failed, try 30 seconds later...
[info 2024-12-07 16:43:11 hostinfo.(*SHostInfo).ensureMasterNetworks(hostinfo.go:1246)] Master ip 192.168.100.2 to fetch wire
[info 2024-12-07 16:43:11 hostinfo.(*SHostInfo).tryCreateNetworkOnWire(hostinfo.go:1217)] Get master ip 192.168.100.2 and mask 24
[error 2024-12-07 16:43:11 hostinfo.(*SHostInfo).onFail(hostinfo.go:1142)] register failed: initHostRecords: initHostRecord: try create network: find_matched == false: InvalidStatusError
[error 2024-12-07 16:43:11 hostinfo.(*SHostInfo).onFail(hostinfo.go:1148)] register failed, try 30 seconds later...
[info 2024-12-07 16:43:39 ovnutils.configBridgeMtu.func1(ovnutils.go:42)] set brvpc MTU to 1500 success!
[info 2024-12-07 16:43:41 hostinfo.(*SHostInfo).ensureMasterNetworks(hostinfo.go:1246)] Master ip 192.168.100.2 to fetch wire
[info 2024-12-07 16:43:41 hostinfo.(*SHostInfo).tryCreateNetworkOnWire(hostinfo.go:1217)] Get master ip 192.168.100.2 and mask 24
[error 2024-12-07 16:43:41 hostinfo.(*SHostInfo).onFail(hostinfo.go:1142)] register failed: initHostRecords: initHostRecord: try create network: find_matched == false: InvalidStatusError
[error 2024-12-07 16:43:41 hostinfo.(*SHostInfo).onFail(hostinfo.go:1148)] register failed, try 30 seconds later...
[info 2024-12-07 16:44:11 hostinfo.(*SHostInfo).ensureMasterNetworks(hostinfo.go:1246)] Master ip 192.168.100.2 to fetch wire
[info 2024-12-07 16:44:11 hostinfo.(*SHostInfo).tryCreateNetworkOnWire(hostinfo.go:1217)] Get master ip 192.168.100.2 and mask 24
[error 2024-12-07 16:44:11 hostinfo.(*SHostInfo).onFail(hostinfo.go:1142)] register failed: initHostRecords: initHostRecord: try create network: find_matched == false: InvalidStatusError
[error 2024-12-07 16:44:11 hostinfo.(*SHostInfo).onFail(hostinfo.go:1148)] register failed, try 30 seconds later...

@zexi
Copy link
Member

zexi commented Dec 9, 2024

@Misswjy 要看下平台有没有包含 110.xx.xx.xx 和 192.168.100.2 这两个 ip 的子网

@Misswjy
Copy link
Author

Misswjy commented Dec 9, 2024

@Misswjy 要看下平台有没有包含 110.xx.xx.xx 和 192.168.100.2 这两个 ip 的子网

有110的没有192

@zexi
Copy link
Member

zexi commented Dec 9, 2024

@Misswjy 要看下平台有没有包含 110.xx.xx.xx 和 192.168.100.2 这两个 ip 的子网

有110的没有192

那创建包含 192.168.100.2 这个 ip 的子网再重启 host 服务试试

@Misswjy
Copy link
Author

Misswjy commented Dec 9, 2024

@Misswjy 要看下平台有没有包含 110.xx.xx.xx 和 192.168.100.2 这两个 ip 的子网

有110的没有192

那创建包含 192.168.100.2 这个 ip 的子网再重启 host 服务试试
我看新建192网络需要网关,但是我192这个网络没有网关

@Misswjy
Copy link
Author

Misswjy commented Dec 9, 2024

@Misswjy 要看下平台有没有包含 110.xx.xx.xx 和 192.168.100.2 这两个 ip 的子网

有110的没有192

那创建包含 192.168.100.2 这个 ip 的子网再重启 host 服务试试

一台服务器不能有两个网关吧

@zexi
Copy link
Member

zexi commented Dec 16, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

@Misswjy
Copy link
Author

Misswjy commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

@zexi
Copy link
Member

zexi commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

@Misswjy
Copy link
Author

Misswjy commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

屏幕截图 2024-12-27 144016
修改后报错 pod起不来

@Misswjy
Copy link
Author

Misswjy commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

是否应该改为br0,因为eth0上的ip现在在br0上

@zexi
Copy link
Member

zexi commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

是否应该改为br0,因为eth0上的ip现在在br0上

可以重启下操作系统,正常的情况是先查询 eth0 ,然后获取到 ip 后才有 br0 。

@Misswjy
Copy link
Author

Misswjy commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

是否应该改为br0,因为eth0上的ip现在在br0上

可以重启下操作系统,正常的情况是先查询 eth0 ,然后获取到 ip 后才有 br0 。
我重启了 ,还是不行,显示eth0上没有ip

@Misswjy
Copy link
Author

Misswjy commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

是否应该改为br0,因为eth0上的ip现在在br0上

可以重启下操作系统,正常的情况是先查询 eth0 ,然后获取到 ip 后才有 br0 。

修改为br0就好了 ,这是否是一个bug

@zexi
Copy link
Member

zexi commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

是否应该改为br0,因为eth0上的ip现在在br0上

可以重启下操作系统,正常的情况是先查询 eth0 ,然后获取到 ip 后才有 br0 。

修改为br0就好了 ,这是否是一个bug

看了下代码的流程,https://github.com/yunionio/cloudpods/blob/master/pkg/hostman/hostinfo/hostinfo.go#L223-L230 ,确实是应该写成 br0 ,是先创建的 bridge 网桥,再解析的配置。

@Misswjy
Copy link
Author

Misswjy commented Dec 27, 2024

@Misswjy 管理口和 host.conf 里面的 listen_interface 有关系,没设置的话就是 networks 里面的第一个作为管理口

在host文件没见listen_interface 是要在host文件添加这个位管理口ip吗?

需要手动添加 listen_interface: <网卡名>

是否应该改为br0,因为eth0上的ip现在在br0上

可以重启下操作系统,正常的情况是先查询 eth0 ,然后获取到 ip 后才有 br0 。

修改为br0就好了 ,这是否是一个bug

看了下代码的流程,https://github.com/yunionio/cloudpods/blob/master/pkg/hostman/hostinfo/hostinfo.go#L223-L230 ,确实是应该写成 br0 ,是先创建的 bridge 网桥,再解析的配置。

平台没有显示192.168.100.2为业务口,是bug还是前端就没有写这个业务口

@zexi
Copy link
Member

zexi commented Dec 30, 2024

@Misswjy 哪里显示的业务口,请截图发上来看下

@Misswjy
Copy link
Author

Misswjy commented Dec 31, 2024

@Misswjy 哪里显示的业务口,请截图发上来看下

屏幕截图 2024-12-09 123548
现在110这里显示业务口,192这里能不能显示为业务口

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working state/awaiting processing
Projects
None yet
Development

No branches or pull requests

2 participants